Каталог лингвистических программ и ресурсов в сети Программы анализа и лингвистической обработки текстов
Название | Автор(ы), организация | Комментарий |
Link Grammar Parser http://bobo.link. cs.cmu.edu/link/ | John Lafferty, Daniel Sleator, Davy Temperley, Carnegi Melon University, USA | Link Grammar Parser — это синтаксический парсер1 английского языка. Программа распространяется бесплатно. |
Russian Morphological Dictionary http://www. geocities.com/ Si I icon Valley/ Bit/1116/ | Sergey Sikorsky ■ | Программа для синтаксического и морфологического анализа русскоязычных текстов. Распространяется бесплатно. |
On-line морфологический парсер http:// www.comptek.ru/ alta.html | flndex | Для просмотра результатов морфологического анализа нужно выбрать режим Разбор запроса. |
Mystem http:// corpora.narod.ru/ mystem/ | Илья Сегалович, Виталий Титов, компания flndex | Компактный, очень быстрый и бесплатный морфологический парсер русскоязычных текстов, реализованный на основе словаря А.А. Зализняка. |
'
■
Парсер — анализатор.
Лингвоанали- затор http://www.rusf.ru/ books/analysis/ index.htm | Д.В. Хмелев | On-line версия программы математического анализа структуры текста. Целью анализа является определение близости любого из предлагаемых пользователем текстов к одному из авторских эталонов, определенных заранее. |
Программные продукты фирмы LingSoft http:// www.lingsoft.fi/en/ products.html | LingSoft, Финляндия -■ | Компоненты грамматического разбора, морфологического анализа и лемматизации (нормализации) для английского, немецкого, финского, датского, норвежского, шведского, эстонского и русского языков. Это коммерческие продукты, которые могут быть использованы при разработке других систем. |
Бюро переводов http:// www.dialing.ru/ rml.htm | компания Dialing Москва | Анализ текстов для построения систем автоматического перевода с русского на английский язык (и наоборот). Включает ряд автономных компонентов: |
— синтаксический анализатор текстов на русском языке; — морфологический анализатор текстов на русском и английском языках; — построение конкордансов для заданной совокупности текстов. | ||
Система StarLing http:// | С.А. Старостин | СУБД StarLing, позволяющая работать с мультиязычными |
starling.rinet.ru/ download.htm | текстами большой длины, с транскрипционными знаками, с удобным поиском, с анализом и синтезом словоформ по словарю. | |
Морфологический анализатор http:// starling.rinet.ru/ morph.htm | С.А. Старостин ,,■ | On-line версия программы морфологического анализа слов русского/английского языков. Позволяет получить для вводимого слова базовую форму и морфологическую информацию. Программа реализована на основе словарей А.А. Зализняка (русский язык) и В.К. Мюллера (английский язык). |
ParaConc 0.7beta http:// www.ruf.rice.edu/ -barlow/ parabeta.html ParaConc 1 .Obeta http:// www.ruf.rice.edu/ -barlow/ parac.html | Michael Barlow | Две бесплатные beta-версии программы построения параллельного конкорданса, т.е. конкорданса, основанного на двух сравниваемых текстах. Тексты должны быть выравнены по параграфам (предложениям), т.е. иметь одинаковое число этих элементов. |
WordSmith Tools http:// www.liv.ac.uk/ ~ms2928/ wordsmith/ | Mike Scott | Бесплатная демо-версия программы WordSmith 3.0 для построения конкордансов. Кроме программы Word Smith, можно загрузить различные словари. |
TextAnalyst 2.0 http:// www.analyst.ru/ index1.html? page=dload.htm | Научно-производственный инновационный центр «Микросистемы» | Демо-версия. Позволяет построить семантическую сеть понятий, выделенных в обрабатываемом тексте, со ссылками на контекст. Имеется |
■ ■ | . | возможность смыслового поиска фрагментов текста с учетом скрытых в тексте смысловых связей со словами запроса. Позволяет анализировать текст путем построения иерархического дерева тем/подтем, затрагиваемых в тексте. Также имеется возможность реферирования текста. Еще одна компонента, TextAnalyst Lib, может использоваться для построения гипертекстовых электронных книг. |
Русский филолог http:// www.agama.com/ | АО Агама | Словарно-справочная система по русскому языку. Включает в себя ряд словарей, в том числе морфологический, словообразовательный и словарь синонимов/антонимов. |
Лингвистические компоненты, словари и библиотеки классов http:// linguist.nm.ru/ | Андрей Коваленко | Авторская страничка ведущего разработчика компании Рэмблер, на которой представлены его лингвистические разработки. Можно скачать описания и демо-версии компонентов. |
netXtract http:// www.netxtract.com/ | 2000 Relevant Software Inc. | Замечательная компонента, подключаемая к Microsoft Internet Explorer, которая позволяет получить упорядоченный индекс слов в загруженном HTML документе. Выбранные слова по желанию заносятся в персональную базу знаний, которая позволяет систематизировать найденные документы удоб- |
ным образом. Можно скачать | ||
бесплатную версию. | ||
WordTabulator | СВ. Логичев, | Позволяет построить упоря- |
v2.2 | 1997—2002 | доченные индексы слово- |
http://www.rvb.ru/ | форм или словосочетаний | |
soft/index, htm I | заданной размерности для | |
множества входных текстов. | ||
Понимает тексты в основных | ||
■■■ | русскоязычных кодировках и | |
может обрабатывать доку- | ||
менты в формате HTML 4.01, | ||
игнорируя их разметку. | ||
WordStat | А.Г. Дубинский, | Бесплатная утилита2 подсче- |
http:// | та частоты встречаемости | |
dubinsky.nm.ru/ | различных слов в текстовых | |
wordstat.htm | или html-файлах. | |
Технологии | Гарант-Парк- | Сайт, на котором представ- |
поиска и анализа | Интернет | лены разработки известной |
текстовой | компании «Гарант-Парк-Ин- | |
информации | тернет». Среди представ- | |
http://www.rco.ru/ | ленных технологий: | |
— анализ и классификация | ||
текстов, автоматическое | ||
реферирование; | ||
— морфологический, син- | ||
таксический и семанти- | ||
ческий анализ текста; | ||
— средства навигации по | ||
большим массивам | ||
текстов; | ||
■ | — различные научные пуб- | |
ликации авторов проекта. |
2 Утилита — программа обслуживания, системная программа, предназначенная для оказания услуг общего характера пользователям и обслуживающему персоналу си-
стемы обработки информации.
Психолингвистические программы
Название | Автор(ы), организация | Комментарий |
ПСИ-Офис | Вадим Сысуев | Система психолингвистиче- |
версия 2.1 | ского анализа текстов, вклю- | |
http:// | чающая три компоненты: | |
psy-two.narod.ru/ | ||
— программа поиска вло- | ||
женных слов в тексте, | ||
т.е. слов, спрятанных | ||
внутри и на переходах | ||
между словами; | ||
— программа поиска повто- | ||
ряющихся фрагментов | ||
текста при анализе «ав- | ||
1 | томатического письма» | |
(такие тексты пишутся с | ||
целью анализа текущих | ||
подсознательных про- | ||
цессов); | ||
— программа синтеза под- | ||
сознательного компонен- | ||
та текста. Поддержка | ||
русского (словарь | ||
690 тыс. слов) и | ||
английского (словарь | ||
430 тыс. слов) языков. | ||
ВААЛ-2000 | В.П. Белянин, | Психолингвистическая экс- |
http:// | д-р филол. | пертная система лексическо- |
vaal2000.newmail. | наук, МГУ | го и контент-анализа текстов. |
ru/vaal2000.htm | В.И. Шалак, | Основные задачи — прогноз |
канд. филос. | эффекта неосознаваемого | |
наук (Институт | воздействия текста на мас- | |
философии РАН) | совую аудиторию, анализ | |
текстов с точки зрения такого | ||
воздействия, генерация тек- | ||
ста с заданным вектором |
воздействия, выявление лич- | ||
ностно-психологических ка- | ||
честв автора текста. Успеш- | ||
но используется в Госдуме, | ||
Правительстве РФ, крупных | ||
банках и PR-компаниях. | ||
ПРИЕМЫ | Система | Коммерческая программа, |
ЖУРНАЛИСТИ- | «ТРИЗ-ШАНС», | представляющая собой кон- |
КИ & PUBLIC | Санкт-Петербург | сультанта, помогающего |
RELATIONS, | пользователю при написании | |
версия 2.03, | различных текстов. Пользо- | |
ватель выбирает ряд пара- | ||
http://www.triz- | метров, характеризующих | |
chance.spb.ru/ | желаемый результат, а про- | |
грамма выдает ему рекомен- | ||
дации по написанию текста | ||
и иллюстрирует их примера- | ||
ми. В основе программы — | ||
анализ 12 500 текстов масте- | ||
■ | ров русского языка, начиная | |
от писателей-классиков и | ||
заканчивая современными | ||
журналистами и политиками. | ||
■ | К сожалению, в программе | |
отсутствуют возможности | ||
анализа написанного поль- | ||
зователем текста. Для загруз- | ||
ки доступна демо-версия, | ||
■ | являющаяся облегченным | |
вариантом профессиональ- | ||
ной версии. Демо-версия | ||
также включает руководство | ||
пользователя и демонстра- | ||
ционный обучающий ролик. | ||
Программа требует для ра- | ||
боты русские Windows 9x/ | ||
2000/NT и Microsoft Word. |
ну или организацию. Исполь- | ||
зует для работы словарь лек- | ||
■ | сической информации, кото- | |
рый на сегодняшний день | ||
включает более 7000 элемен- | ||
тов. Язык реализации — ан- | ||
глийский. | ||
Cyrano Server | Nando.net | On-line версия программы |
http://www. | генерации любовных писем. | |
nando.net/toys/ | Пользователь задает стиль | |
cyrano/version2/ | ■ | сочинения,свое имя, обра- |
compose- | щение к любимой и некото- | |
cyrano.html | рые атрибуты, ее характери- | |
зующие, и программа ловко | ||
■ | сочиняет письмо нужной | |
тональности. Язык реали- | ||
зации — английский. | ||
Письмовник | MediaLigua Ltd., | Автоматическое составление |
http://www. | 1995—2002 | и перевод (русско-английский / |
medialingua.ru/ | англо-русский) деловых пи- | |
pismovnik.html | сем и документов. Коммер- | |
ческая система для Windows | ||
95/98, $49. | ||
A.L.I. C.E | Dr. Richard | Говорящая программа. В ос- |
http://www. | S. Wallace | нове технологии, на которую |
alicebot.org/ | опирается A.L.I.С.Е., лежит | |
alice_page.htm | использование AIML (специ- | |
ализированного языка раз- | ||
метки для искусственного | ||
интеллекта). В разделе | ||
■ | downloads доступен исход- | |
ный код и различные импле- | ||
ментации программы. | ||
The Dada Engine | Andrew С Bulha | Генератор случайных тек- |
http://dev.null.org/ | стов на основе заданной | |
dadaengine/ | грамматики (на английском | |
языке). |
Sakrament Text-to-Speech Engine v2.0 http:// sakrament.com/ | компания «Сакрамент», 2002 | Система синтеза русской речи,созданная минской компанией «Сакрамент». Система польностью соответствует стандарту Microsoft Speech API (SAPI) 5.1. Позволяет произносить тексты мужским и женским голосами, делая при этом инфонационные паузы, изменяя по желанию пользователя тон и тембр речи. |
Аки Росс http:// www.akirossbot. narod.ru/ 1 ■ | Альберт Товмасян, 2002 - | Shareware — программа, предлагающая общение на русском языке. Специальный plug-in позволяет использовать анимацию в виде очаровательной девушки-собеседника по имени Аки Росс (так звали героиню компьютерного мультика «Final Fantasy»). База знаний программы не столь обширная, но теоретически ее можно улучшать и дополнять (используется язык разметки AIML). Незарегистрированная версия запускается всего 10 раз сеансами по 2 минуты. |
PAI V3.01 http://utenti.quipo. it/claudioscordino/ pai.html | Claudio Scordino, 2002 | Programmable Artificial Intelligence (PAI), или Программируемый Искуственный Интеллект, — это freeware про- |
грамма, способная общаться с пользователем на английском языке. Что наиболее интересно в PAI, так это способность обучения. Пользователь постепенно может научить программу понимать нужные фразы, слова, глаголы и даже команды! Реализована на языке C++ для Linux, FreeBSD и Windows.
Системы обработки естественного языка (NL-Processing)
Название | Автор(ы), организация | Комментарий |
Natural Language Projects at ISI http://www.isi.edu/ natural-language/ nlp-at-isi.html ■ | Univ.of Southern California/ Information Science Inst, 1999—2001 | Описание группы проектов по вычислительной лингвистике и машинному переводу. Webclopedia — проект, связанный с созданием информационных агентов, способных генерировать ответы пользователю на основе анализа разнородных коллекций ресурсов, доступных в сети. ONTOSAURUS — это онтологический тезаурус, включающий 90000 концептуальных сущностей. SUMMARIST — мультиязыч-ная система реферирования текстовой информации. ReWrite — система двуязычного перевода,основанная на статистическом анализе пар текстовых корпусов. |
Следопыт 3.0 | MediaLingua | Интеллектуальная поисковая |
http:// | Ltd., 2001 | система, применимая для |
www.sledopyt.ru/ | смыслового и нечеткого по- | |
иска документов на русском | ||
и/или английском языках. | ||
При поиске учитывается мор- | ||
фология и изменение грам- | ||
матических форм элементов | ||
поискового запроса. Понима- | ||
ет все основные форматы | ||
документов для Windows. | ||
Цена от $9,9 до $1290 в за- | ||
висимости от комплектации. | ||
Поисковая | ВЕЛТОН. | Персональная поисковая си- |
система Алхимик | SOFT, 2002 | стема Алхимик, предназна- |
http://www.soft. | ченная для анализа и поиска | |
velton.net.ua/ | русскоязычных документов. | |
langs download. | Программа использует фраг- | |
html | менты семантического сло- | |
варя профессора В.А. Тузо- | ||
ва. Входными документами | ||
могут быть файлы в форма- | ||
тах MS Word, HTML и TXT. | ||
ARM Engine 4.0 | ABBYY Software | ABBYY Retrieval & Morphology |
http://www.abbyy. | House, 2001 | (ARM) Engine — коммерче- |
ru/products/arme/ | ская инструментальная си- | |
index.htm | стема, позволяющая встраи- | |
вать в разрабатываемые при- | ||
ложения функции полнотек- | ||
стового поиска и морфологи- | ||
ческого анализа текстов. | ||
Поддерживает практически | ||
все европейские языки, вклю- | ||
чая русский. Реализована | ||
в виде API с использованием | ||
технологии СОМ-объектов. | ||
Демо-версию можно полу- | ||
чить бесплатно. |
6 Заказ 105
NeurOK Semantic | НейрОК | Программные продукты для |
Suite | Интел софт, | поиска и анализа в текстовых |
http://soft.neurok. | массивах информации, реа- | |
ru/products/ | ■ | лизованные с использовани- |
semantic.shtml | ем технологии нейронных | |
. | сетей. Серьезные цены соот- | |
■ !■ ■ '■ • ! | ветствуют серьезности са- | |
мих продуктов. |
Коллекции ресурсов | ||
Название | Автор(ы), организация | Комментарий |
Каталог | SIL International | Обширный каталог программ |
программ | (Summer Institute | по вычислительной лингви- |
по вычисли- | of Linguistics) | стике. Представленные в |
тельной | каталоге программы носят | |
лингвистике | явно академический харак- | |
http://www.sil.org/ | тер и требуют значительных | |
computing/ | усилий для изучения и при- | |
менения. Все программы, а | ||
их более 60, являются бес- | ||
платными и доступны для | ||
on-line загрузки. | ||
Каталог | SIL International | Обширная коллекция ссылок |
программ | на программы чрезвычайно | |
по вычисли- | широкой лингвистической на- | |
тельной | - | правленности в сети Internet. |
лингвистике | Но совсем нет программ, по- | |
в сети Internet | священных русскому языку. | |
http://www.sil.org/ | Представлены как бесплат- | |
linguistics/ | ные, так и коммерческие | |
computing.html | программы. | |
Каталог про- | Michael Barlow | Интересная подборка доступ- |
грамм в Corpus | ного в сети лингвистического | |
Linguistics | ■ | программного обеспечения. |
http://www.ruf. | ||
rice.edu/-barlow/ | .. ■ • ■ ;, | ■ |
corpus. html# | ||
Software | ||
Каталог ресурсов | Harald Klein | Обширная компиляция ссы- |
по анализу | •" • : . > ' ' | лок по проблеме анализа |
текстов | ■ С HNfil . ■ | текстов (на английском язы- |
http://www.intext. | ■ <\ •■■: | ке). Большой раздел посвя- |
del textanae.htm | щен тематическим компью- | |
терным программам. | ||
Ресурсы, | Matthias | Электронный каталог ресур- |
связанные | Romppel | сов, связанных с анализом |
с анализом | текстов (на англ. языке). | |
текстов | Библиографии, программное | |
http://www. | обеспечение, адреса иссле- | |
content-analysis. | довательских организаций, | |
de/index.html | • | архивы электронных текстов |
и другое. | ||
Русский | Юрий Коряков | Авторская коллекция ссылок |
Лингвистический | на языковые ресурсы по | |
указатель создан | ■ ■ ■ . | следующим разделам: |
15 мая 1999 | — языки народов России | |
http://isabase. | (славянские, уральские, | |
philol.msu.ru/ | кавказские и др.) и мира; | |
—jirik/rusling.html | ||
— некоторые направления | ||
лингвистики (компарати- | ||
вистика, социолингви- | ||
стика, вычислительная | ||
лингвистика, типология); | ||
— словари; | ||
— адреса российских орга- | ||
низаций, связанных | ||
с лингвистикой. | ||
Полезныессылки | А.А. Поликарпов, | Большая коллекция ссылок |
для лингвистов | МГУ | на лингвистические ресурсы, |
http://humlang. | проекты, конференции, орга- | ||
newmail.ru/ | низации. | ||
h_link_r.htm | |||
Справочно-ин- | МО «ЭЛЕКС», | Замечательный ресурс для | |
формационный | истинных любителей рус- | ||
портал | ской словесности. Включает | ||
«Русский язык» | онлайновые словари рус- | ||
http://www. | ! | ского языка: | |
gramota.ru/ index.html | — орфографический сло- | ||
варь русского языка под | |||
■ | ред. В.В. Лопатина; | ||
— словарь трудностей про- | |||
Г' ;*•; | изношения и ударения | ||
в современном русском | |||
языке; | |||
— новый словарь русского | |||
языка. Толково-словооб- | |||
разовательный; | |||
— русское словесное уда- | |||
рение. Словарь нарица- | |||
тельных имён; | |||
— русское словесное уда- | |||
рение. Словарь имён | |||
собственных. |
■.
Словари и тезаурусы
Название | Автор(ы), организация | Комментарий |
Словарь В. Даля http://vidahl. agava.ru/ | ■ | On-line версия знаменитого словаря В. Даля «Толковый словарь живого великорусского языка». |
On-line словари | 1997—2000 | Коллекция on-line словарей: |
Издательского | ETS Publishing | анатомический (латынь), |
Дома «ЭТС» | House | уфологический, словарь со- |
http://www.ets.ru/ | кращений, иностранных слов, | |
udict-r.htm | финско-русский, немецко-рус- | |
ский, англо-русский фразео- | ||
логический и ряд других. Кро- | ||
■ | ме этого, на сайте представ- | |
лены языковые программы. | ||
Словари | C.A. Старостин | On-line версии словарей |
Ожегова | ; | С.Н. Ожегова и А.А.Зализ- |
и Зализняка | : . | няка. |
http://starling. | ; .. | |
rinet.ru/cgi-bin/ | ■: | |
main.cgi?flags= | ||
wygnmnl | ||
Acronim finder | Mountain | Полный словарь акронимов и |
http:// | Data Systems | сокращений английского |
acronymfinder.com | языка. Содержит более | |
173 тыс. элементов. | ||
Lexical FreeNet | Datamuse | On-line тезаурус английского |
http://www. | Corporation | языка. Может использовать- |
lexfn.com/ | ся для любых мыслимых | |
целей: поиска синонимов, | ||
: | связанных слов, подбора | |
рифм, орфографической | ||
проверки и т.д. | ||
The Wordsmyth | Wordsmyth | On-line версия образова- |
Educational | Collaboratory | тельного словаря-тезауруса |
Dictionary | ■ | английского языка. Содер- |
Thesaurus | жит около 50 тысяч корен- | |
(WEDT) | ных слов. Пользователь | |
http://www. | может получить расклад | |
wordsmyth.net/ | интересующего слова по | |
слогам, его произношение, | ||
• | список всех словоформ и | |
толкование. |
Толковый | Merriam-Webster | On-line версия знаменитого |
словарь | Incorporated | толкового словаря англий- |
Merriam-Webster | ского языка. | |
http://www.m-w. | '■■ '■ | |
com/ | ||
Babylon.com | Babilon.com Ltd. | Сайт, предоставляющий раз- |
http:// | личные услуги: мультиязыч- | |
www.babylon.com/ | ный перевод, словари и спра- | |
вочники, преобразование од- | ||
них мер в другие и т.д. Поль- | ||
зователь получает доступ | ||
к ресурсам системы после | ||
установки на свою локаль- | ||
ную машину интерфейса | ||
Babylon. Он может опреде- | ||
лять состав необходимых | ||
. ■ | ему словарей, языковые на- | |
стройки и режимы работы | ||
(off-line или on-line) и даже | ||
• | создавать свои собственные | |
словари. Плата за пользова- | ||
ние не взимается! | ||
РУБРИКОЙ | Russ Portal | В настоящее время на сер- |
http://www. | Company Ltd. | вере опубликованы: |
rubricon.ru/ | ||
— «Большая советская | ||
■ | энциклопедия» | |
(1969—1979); | ||
— «Иллюстрированный | ||
энциклопедический | ||
словарь» (1998); | ||
— «Толковый словарь жи- | ||
вого великорусского язы- | ||
ка» Владимира Даля | ||
(1863—1866); | ||
— «Рок-энциклопедия» Сер- | ||
гея Кастальского (1998); |
■■ '.''■' ■ : ■ | — Энциклопедический словарь «История Отечества»; — Энциклопедический словарь «Всемирная история». | |
British National Corpus (BNC) http://info.ox. ac.uk/bnc | 1995 Oxford University Press ■ ■ ■ | Коллекция более чем 100 миллионов слов современного английского письменного и устного языка. В режиме on-line поиска пользователь может найти примеры употребления как отдельных слов, так и выражений. |
Англо-русский словарь Мультилекс™ 1.0 http:// www.multilex.ru/ online.htm | MediaLingua Ltd. 2000 . ■ | On-line версия знаменитого трехтомного словаря НБАРС под редакцией проф. Э.М. Медниковой и акад. Ю.Д. Апресяна (250 000 словарных входов, 2 300 000 английских и русских слов). |
Обратные и частотные словари русского языка http://speakrus. narod.ru/ zaliznyak/ zalizn.htm | Арнольд | Обратный и обычный словари, образованные из словаря А.А. Зализняка (93 392 слова). Обратный и обычный словари Про-Линг (125 723 слова). Обратный, обычный и частотный словари, полученные в результате анализа произведений русской литературы XIX—XX вв. (162 232 слова). |
Словарь сокращений русского языка http:// www.sokr.ru/ | Студия Артемия Лебедева | On-line словарь сокращений русского языка, включающий на сегодня более 53 000 статей. |
«Словарь сокращений рус- | ||
■ | ского языка» {1984); | |
«Новый словарь сокращений | ||
русского языка» (1995); | ||
... .I | ■ ' ■ | «Новые сокращения в русском |
■ | ■ | языке 1996—1999» (1999). |
Гиперсловарь | РосНИИ | Гиперсловарь «Ариадна» — |
Ариадна | искусственного | проект создания универсаль- |
http:// | интеллекта | ной среды для систем авто- |
www.artint.ru/ | матической обработки рус- | |
packin/abrial/ | ского текста. По форме ги- | |
ariadna.htm | ■ | персловарь является базой |
данных Абриаль, включаю- | ||
щей грамматическую компо- | ||
ненту на основе словаря | ||
■■ " ! ■ . | А.А. Зализняка, позволяю- | |
. ... . ,■■. . | щую получать склонения и | |
■ ■ | ■ | спряжения слов и морфо- |
логическую компоненту. |
■■■;■■,■
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
Основная
1. Информатика для юристов и экономистов / СВ. Симонович, ГА. Евсеев, В.И. Мураховский, А.Ю. Казуто; под ред. СВ. Симоновича. СПб.: Питер, 2001.
2. Кудрявцева Т.Н. Введение в Интернет: Методическое пособие. Ярославль: МУБиНТ, 2002.
■
Электронные ресурсы
3. Каталог лингвистических программ и ресурсов в Сети [Электрон
ный ресурс] / Сост. СВ. Логичев; Русская виртуальная библиоте
ка. М.: РВБ, 1999—2004. — Режим доступа: http://www.rvb.ru/soft/
catalogue/catalogue. html.
4. Компания ПРОМТ: технологии машинного перевода [Электрон
ный ресурс]. М.: ООО «ПРОМТ», 2003—2004. — Режим доступа:
http://www.translate.ru.
5. Международная конференция ДИАЛОГ [Электронный ресурс] / Ас
социация «Компьютерная лингвистика и интеллектуальные тех
нологии». М.: КОЛИНТ, [2004] — Режим доступа: http://www.
dialog-21.ru.
6. Языковые и лингвистические проекты в Интернете [Электронный
ресурс]: Указатель ресурсов / Веб-каталог EGO: страны мира, язы
ки и Интернет. М., 1999—2002. — Режим доступа: http://www.Hnks-
guide.ru/sprachen/yazyki-projekty.html.
ОГЛАВЛЕНИЕ
1. ИНФОРМАЦИЯ. ИНФОРМАЦИОННЫЕ
ТЕХНОЛОГИИ.......................................................................3
1.1. Информация.................................................................... 3
1.1.1. Информационный обмен, сигналы, данные.... 3
1.1.2. Методы воспроизведения
и обработки данных............................................ 5
1.1.3. Понятие информации................ ,....................... 9
1.1.4. Понятие контекстного метода
и особенности информационного процесса
в вычислительной технике.............................. 10
1.1.5. Свойства информации...................................... 12
1.2. Данные........................................................................... 17
1.2.1. Носители............................................................ 17
1.2.2. Операции............................................................ 18
1.2.3. Основные структуры данных.......................... 20
1.3. Автоматическая обработка........................................ 22
1.3.1. Состав вычислительной системы.................... 22
1.3.2. Классификация прикладных программ.......... 24
1.3.3. Периферийные устройства.............................. 26
1.4. Интеллектуальные информационные системы........ 28
1.4.1. Искусственный интеллект
(Artificial Intelligence)........................................ 28
1.4.2. Нейронные сети................................................ 29
1.4.3. Экспертные системы........................................ 31
2. ОБЗОР ЛИНГВИСТИЧЕСКИХ ПРОГРАММ.....................37
2.1. Виды лингвистических программ.............................. 37
2.1.1. Текстовые процессоры...................................... 40
2.1.2. Программы анализа и лингвистической
обработки текстов.............................................. 47
2.1.3. Генераторы текстов и «говорящие»
программы.......................................................... 51
2.2. Машинный перевод...................................................... 53
2.2.1. Основные этапы развития
машинного перевода......................................... 53
2.2.2. Как переводит компьютер................................ 54
2.2.3. Классификация систем..................................... 58
2.2.4. Инновационные технологии
компании ПРОМТ............................................. 61
2.3. Компьютерная лингвистика:
нестандартные применения......................................... 63
2.3.1. Определение языка сообщения........................ 63
2.3.2. Взлом шифров.................................................... 64
2.3.3. Установление авторства................................... 65
2.3.4. Построение роботов-поисковиков
и снифферов....................................................... 65
2.3.5. Построение роботов-автоответчиков.............. 66
ЗАКЛЮЧЕНИЕ.......................................................................... 68
ПРИЛОЖЕНИЕ......................................................................... 69
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА............................................ 89
Учебное издание