en ru
Автоматическая Обработка Текста
20.04.2011. Если вы умеете пользоваться нашими компонентами или вас просто интересует компьютерная лингвистика, machine learning для лингвистики, программирование для лингвистики - пишите мне (Алексей Сокирко, sokirko@yandex.ru), возможно, я смогу найти для вас интересную работу в компании Яндекс. Подробнее: http://aot.ru/vacan.html
Рабочая группа Aot.ru разрабатывает программное обеспечение в области автоматической обработки текста. В круг наших интересов в основном входит анализ русского языка.
Наш подход скорее можно назвать консервативным, чем революционным. Мы не верим ни в какую общую суперидею, объясняющую сущность естественного языка. Вместе с тем мы считаем, что только грамотная декомпиляция языковых механизмов позволит максимально приблизить человеческий язык к современному компьютеру.
Начиная с 2002 года мы выкладываем наши разработки с лицензией LGPL. Теперь каждый может бесплатно использовать наши библиотеки в своих программах, в том числе и в коммерческих приложениях.
Мы призываем всех, кто заинтересован в развитии компьютерной лингвистики, к широкому сотрудничеству.
Наши корни – факультет лингвистики в РГГУ. Большинство из нас - выпускники этого факультета, некоторые учатся в аспирантуре, некоторые уже получили кандидатскую степень. Традиционное деление нашей группы на программистов и лингвистов возникло из того, что на факультете лингвистики существовало отделение Искусственного Интеллекта(ИИ), где учили программированию больше, чем на основном потоке. Лингвист с основного потока проходил курсы фонетики, морфологии, синтаксиса, семантики, типологии, компаративистики и т.д. Он обязательно изучал по крайней мере два иностранных языка, хотя обычно количество изучаемых языков было три. Студент ИИ имел один обязательный курс иностранного языка (обычно два), лингвистические курсы, математику(матан, дискретка, логики, линейная алгебра и т.д.) и море программирования (С,С++, Pascal, Prolog, Lisp, Delphi, SQL, Java). Большинство выпускников основного потока становятся переводчиками и секретарями, тогда как большинство выпускников ИИ становятся программистами. Но некоторая часть людей захотела заниматься проектами, связанными с автоматической обработкой текста, т.е. приложением теоретической лингвистики к современным компьютерным технологиям. Но эта наклонность возникла не на пустом месте, ему предшествовало долгое обучение и разговоры с людьми, которых мы считаем своими учителями.
Eng[lish]SynanLib
Ger[man]PostMorph
Ger[man]SynanLib
GraphanLib
Java[JNI]Morph[ology]API
LemmatizerLib
Morpology
SemanLib
SynanLib
translate
Translator
VisualSynan
karp-04-002
1. Наименование системы - Морфологический анализатор morph
2. Информация об авторе - Карпов Валерий Эдуардович, доц., к.т.н., НИИ Информационных технологий, г.Москва
3. Контактная информация - karpov_ve@mail.ru, Москва, ул. Бахурушина 18, НИИ ИТ
4. Аннотация -
5. Описание теоретич. базиса, доп. ссылки -
6. Демо-версии - 1. Морфологический анализатор MORPH
http://www.raai.org/razrabotki/rgupiim/rawmaterials/morph/morph.rar (rar-архив,исходники и т.д., 900K)
2. Ссылка по теме (www.aot.ru)
7. Позиция в рубрикаторе -
8. Стадия существования -
Платформа, ОС - WIN 98/2000/XP
Год разработки - 2003
Тип - распознаватель
Вид реализации - Программный модуль
Вход, вид - Файл, стандартный поток ввода
Вход, описание - текст
Выход, вид - Файл, БД, стандартный поток вывода
Выход, описание - морфологическая структура
Задача - Распознавание текста
Используемый механизм - словарно-шаблонный
Программное представление - morph.exe
Режим работы - пакет
© AIKernel 2011
09.05.2011 - 21.05.2011