14-годишният Радостин Чолаков от пловдивската Математическа гимназия, който стана известен с проектите и наградите си в ИТ сферата, стартира нов проект, съсредоточен върху българската реч и кирилицата. Проектът е наречен “АзБуки.ML” и на практика представлява изкуствен интелект, който разбира български език.
„Съществуват добре развити технологии за компютърна обработка на английски и още няколко други езици, базирани на различни алгоритми, невронни мрежи и на т. нар. изкуствен интелект. Технологичните гиганти развиват свои ML платформи и вероятно някой ден ще има цялостна поддръжка и за българския. Но в момента такава няма. За нашия език има отделни проучвания, научни трудове по темата или отделни компании, които са си създали техни решения, но не и обширна платформа, която да глобализира използването на изкуствен интелект с цел обработка на езика. Ще се опитам да събера съществуващите ресурси, корпуси и т.н., за да разработят с тях нови програми, които досега не са прилагани у нас. Те ще са събрани в една платформа и API, които после български компании, бизнеси, училища да могат да използват”, разказва деветокласникът.
Той дава пример, че ако една голяма компания има Фейсбук страница за връзка с клиенти, може да автоматизира отговорите на част от най-често задаваните въпроси през дадена програма. Вкарвайки този изкуствен интелект обаче, поддръжката за българския език ще стане много по-добра.
Разработката на Радостин ще може да се използва и от медиите. „Когато човек търси някаква новина или информация онлайн, излизат много статии и надали може да изчете всички. Но програмата с изкуствен интелект може да направи нещо като кратък преразказ с няколко изречения на една обширна новинарска тема”, обяснява момчето.
Той уточнява, че подобни чатботове вече съществуват и на български език. Амбицията на Ради е да ги надгради и да ги направи по-лесни за използване.
Платформата все още е на ранен етап. На страницата на проекта https://azbuki-ml.com обаче той вече е публикувал демо на програма за запетайки. Ученикът е създал сложен алгоритъм, с който компютърът да започне да “се обучава” сам.
„Опитах да го науча да поставя запетайки в българската реч, но без да му изписвам граматичните правила на ръка. Събрах няколко стотин хиляди изречения от различни книги и ги вкарах в моя алгоритъм”, обяснява Радостин.
В началото компютърът бил способен да поставя запетаи само в най-елементарните случаи — пред частицата “че” например. Но след доста работа, започна правилно да поставя препинателните знаци в изречения, давани на държавните зрелостни изпити в 12 клас.
„Все още е в ранен стадий и допуска доста грешки. Надявам се обаче, че и с подкрепата на хората, платформата ще се разрасне”, споделя деветокласникът.
Ради е родом от родопското селце Барутин. Занимава се с програмиране още от четвърти клас. Почти всичко е научил сам в интернет. От малък се изявява и по математически състезания. През 2018 печели награди от гиганта Google. Носител е и на наградата “Отличниците на България”. Побеждавал е в международни конкурси по програмиране — и то срещу професионалисти в сферата, и е създател на няколко успешни софтуерни продуктa.