Для создание языковой модели требуется 13 млн токенов.
В Казахстане до конца года создадут казахскую языковую модель Chat-GPT. Проект анонсировал генеральный директор «Центра поддержки цифрового правительства» Рустем Бигари на брифинге в СЦК, передает Sarbaz.kz.
Для того, чтобы Chat-GPT формулировал грамотные ответы с учетом менталитета необходимо 13 млрд токенов. На сегодняшний день сам Chat-GPT от OpenAI в 10 раз меньше – 1,5 млрд токенов.
«До конца года будет разработана языковая модель с учетом нашего менталитета, которая будет предложена обществу. В дальнейшем совместными усилиями будем ее развивать по примеру Южной Кореи, где граждане развивают собственную языковую модель», - сказал Рустем Бигари.
Для разработки модели необходимы производственные мощности. С этой целью министерством цифрового развития, инноваций и аэрокосмической промышленности ведется работа по закупке суперкомпьютеров, которые позволит ученым разработать лингвистическую модель.
Профильным министерством ведется работа с университетами и научно-исследовательскими институтами для сбора данных и поставкой мощностей. Создано два консорциума, а также привлекаются стартап-идеи.
По данным IDC расходы в ИИ, включая программное обеспечение оборудование и специализированные услуги, в 2023 году достигли 154 млрд долларов.