Нова дигитална платформа базирана на вештачка интелигенција за транскрипција на говор на македонски јазик, „Буки“ ќе биде промовирана утре во 14 часот во просториите на ректоратот на Универзитетот „Св.Кирил и Методиј“ во Скопје. Со цел да се следат модерните текови за негување и употреба на македонскиот јазик, УКИМ креираше дигитален модел, базиран на вештачка интелигенција, за препознавање и транскрипција на говор на македонски јазик.
Моделот е креиран од Дејан Порјазовски, експерт за технологии на вештачка интелигенција за препознавање говор од Универзитетот „Аалто“ во Финска, како дел од активностите на Центарот за напредни интердисциплинарни истражувања (ЦеНИИс) при УКИМ, раководен од проф. д-р Ордан Чукалиев.
Порјазовски, во рамки на презентацијата, ќе ги изнесе сите детали за функционалноста на моделот, а на настанот свое обраќање ќе имаат и Стефан Андоновски, министер за дигитална трансформација, проф. д-р Биљана Ангелова, ректорка на УКИМ, проф. д-р Никола Стиков, професор по биомедицински инженеринг на Политехничката школа при Универзитетот во Монтреал и проф. д-р Илина Јакимовска, раководителка на Институтот за етнологија и антропологија при Природно-математичкиот факултет – УКИМ.
На промоцијата ќе се направи споредба помеѓу новиот „Буки“ – Виспер (подобрена верзија на Виспер) и најголемите „опен сорс“ модели достапни во моментов – Виспер (OpenAI) и Мета (Фејсбук).
По промоцијата, дигиталниот модел ќе биде отворен за тестирање. Секој кој сака да придонесе, ќе може да го донира својот глас – да прочита текст на македонски и да го прикачи на платформата Мозила, за што на промоцијата ќе бидат споделени подетални информации. За таа цел, УКИМ ќе започне кампања „Донирај глас“.
Во тренирањето на „Буки“ се употребени оригинални податоци од: Дигиталниот архив за етнолошки и антрополошки ресурси (ДАЕАР) на Институтот за етнологија и антропологија, Природно-математичкиот факултет при УКИМ; аудиоверзијата на меѓународното списание „ЕтноАнтропоЗум“ на истиот институт; аудио подкастот „Обични луѓе“ на Илина Јакимовска; научните видеа од серијалот „Наука за деца“, фондацијата КАНТАРОТ и македонската верзија на Mozilla Common Voice (верзија
18.0).
Во моментов функционира моделот за литературен јазик, но се работи и на втор, кој би ги препознавал македонските дијалекти. Новата дигитална платформа може да им биде од корист на сите кои работат со транскрипција на текст (интервјуа, предавања, теренски белешки, потсетници), на лица со хендикеп, транскрипција и анотација на македонското културно наследство, архиви, снимки во МРТВ итн.
Името „Буки“ произлегува од името на втората буква во глаголицата Ⰱ („буки“) – со значење буква или писмо. На англиски јазик, истото ќе биде транскрибирано со Bookie. Линкот за тестирање на дигиталниот модел ќе биде доставен за време на промоцијата.
The post „Буки“ – дигитална платформа базирана на вештачка интелигенција за транскрипција на говор на македонски first appeared on УМНО.МК.