Как создавался онлайн-словарь sozdik.kz

None
None
АЛМАТЫ. КАЗИНФОРМ - Алматинский программист 20 лет назад начал работу над электронным словарем казахского языка. Сегодня на сайт ежедневно заходят более 50 тысяч человек в день, и по сути, это один из немногих качественных онлайн-словарей в Казахстане. Его основатель Евгений Чуриков рассказал в интервью корреспонденту МИА «Казинформ» о зарождении идеи, преградах на пути ее воплощении и том, что находится по ту сторону экрана лингвистических онлайн-сервисов.  

- Как вам пришла идея создания sozdik.kz 20 лет назад?

- Проект берет начало в 1999 году. Как специалиста, занимающегося интернет-разработками, меня заинтересовала возможность создания механизма отображения страниц в Интернете на казахском языке. В то время это была малоизученная тема, и страниц на государственном языке было очень мало, была эпоха компьютеров с Windows 98, в состав которой не входил ни один шрифт, содержащий буквы казахского языка. После изучения данной темы мне удалось создать страницу на казахском языке на основе технологии динамически подгружаемых шрифтов. В октябре 2000 года я опубликовал результаты своего исследования в статье в казахстанском журнале для того, чтобы другие веб-мастера могли перенять этот опыт.

Успешно создав интернет-страницу на казахском языке, я стал думать о полезном и практическом применении этой технологии.  В результате родилась идея создать двухсторонний казахско-русский и русско-казахский словарь в Интернет, и осенью 1999 года я приступил к ее реализации.

- Что было самое сложное на первых порах - найти инвестиции или специалистов? Вы один работали над сайтом в самом начале?

- Первоначально я работал над проектом один. Первый год работы ушел на создание достаточно полной словарной базы. В 2000 году база была готова, и был написан код первого варианта сайта, затем он был опубликован в Интернете. С 2002 года сайт стал работать по текущему адресу, стала расти его популярность, и в 2004 году был получен небольшой грант. Появилась возможность привлечь к работе над проектом нескольких преподавателей казахского языка, которые осуществили проверку основной словарной базы. 

- На какой мировой опыт создания подобных онлайн-переводчиков полагались?

- Необходимо отметить, что sozdik.kz - это, в первую очередь, словарь, а не переводчик. Словарь позволяет «перевести» только те слова и словосочетания, которые были заложены в базу словаря. Переводчик же позволяет переводить любые произвольные тексты, но это сложная лингвистическая и математическая задача, и она под силу только большим коллективам.

В первые годы определенное влияние на мою работу оказал электронный словарь Lingvo российской компании ABBYY. Также я стараюсь «подсмотреть» интересные решения у других интернет-словарей, какой-то функционал придумываю сам. Ценные рекомендации и пожелания также приходят от пользователей словаря.

- Обращались ли в госорганы за финансовой поддержкой? Или вам было интереснее работать с грантами международных фондов и банков?

- В госорганы за финансовой поддержкой я не обращался. В 2004 году был получен грант от казахстанского представительства международного фонда, а в 2013 году проекту помог один из казахстанских банков, разместив на сайте и в наших приложениях рекламу своих услуг. В настоящее время проект существует за счет размещения баннерной рекламы на страницах сайта.

- По своему опыту можете ли сказать, что выучить казахский язык не так сложно?

- Я не владею казахским языком на хорошем разговорном уровне. Но, ввиду специфики своей работы, знаю довольно много казахских слов, иногда даже могу помочь посетителям на сайте с ответами на их вопросы. Вообще, изучение любого языка требует времени и усилий, также очень большое значение имеет регулярность занятий. Знаю это по собственному опыту изучения английского и испанского языков.

- Мы видим, что sozdik.kz старается переводить русские словосочетания и некоторые предложения не дословно, а именно по смыслу. А остались ли такие предложения и словосочетания, которые пока невозможно перевести по смыслу? Как решается этот вопрос?

- Да, устойчивые словосочетания, называемые фразеологическими оборотами, обязательно необходимо переводить не дословно, а по смыслу. Безусловно, осталось еще множество словосочетаний, фразеологизмов, пословиц и поговорок, которые пока не вошли в электронную базу словаря. Данная задача решается путем постепенного пополнения словарной базы.

- Большой ли сейчас штат у sozdik.kz? Проводятся ли обновления в базе данных, добавляются ли новые слова?

- Я продолжаю работу над проектом в основном один. Но у меня есть хороший знакомый Аскар Сыздыков из Астаны, он является разработчиком Android и iOS приложений sozdik.kz. Мы живем в разных городах, но отлично взаимодействуем, в результате у проекта имеются удобные и качественные мобильные приложения.

Периодически я подключаю к работе над словарной базой переводчиков, прошу проверить определенные фрагменты словарной базы. Также, когда позволяют финансы, то заказываю на студии озвучку - на данный момент профессиональным диктором озвучено более 16 000 казахских слов. Добавления и изменения в базе происходят достаточно часто. У проекта есть даже добровольные помощники, которые регулярно отправляют исправления и дополнения словарных статей.

- Чаще слышите хвалебные отзывы о работе сайта, или есть завистники, недоброжелатели?

- В основном, пользователи нашего сайта и приложений оценивают работу положительно. В этом можно убедиться, если зайти на страницу отзывов нашего Android приложения. Примечательно, что пользователи словаря с хорошим или отличным знанием казахского языка ставят чаще положительные оценки. Словарем пользуются и профессиональные переводчики, которые могут уточнить значение определенного слова и посмотреть примеры его использования.

Отрицательные оценки исходят от людей, которые не разобрались с механизмом работы сайта. Такие люди пытаются перевести произвольный текст, либо вводят слово с ошибками в правописании, либо вводят словоформу, а не начальную форму слова. В таких случаях словарь не может помочь с переводом.

- Каким бы хотели видеть sozdik.kz в будущем?

- Необходимо пополнить словарную базу словаря, особенно в казахско-русском направлении. Продолжить озвучку казахских слов. Полезно было бы добавить морфологию казахского языка, чтобы словарь cмог осуществлять переводы в большем количестве случаев. Хотелось бы добавить англо-казахское и казахско-английское направления перевода. Технически на сайте все готово к реализации данных задач. Нам было бы интересно сотрудничество в рамках государственного-частного партнерства для осуществления данных задач.

Сейчас читают