Эта цель достижима в результате решения нескольких задач: • показать студенту возможности информационных технологий в обучении и самообразовании; студента • научить пользоваться программными продуктами, ориентированными на задачи избранной специальности, начиная с простейших – обработки текста, проверки правописания, использования электронных словарей и ресурсов библиотек – до более сложных, таких как программы автореферирования, квантитативные методы обработки лингвистических данных, поисковые системы, программы машинного перевода, программы распознавания и синтеза звучащей речи и др.; • выработать практические навыки обращения к интернет-ресурсам по гуманитарным дисциплинам; • использовать полученные знания и навыки при выполнении курсовых, а затем и выпускной квалификационной работы. <...> Основные задачи систем обработки и распознавания звучащей речи. <...> Лингвистические корпуса как источник информации о языке, их практическое использование. <...> Современные корпуса текстов: национальный корпус русского языка; Британский национальный корпус; другие иноязычные лингвистические корпуса. <...> Поддерживающие информационные технологии – это совокупность информационных ресурсов, к которым специалист постоянно обращается за поддержкой и советом: найти нужную информацию, отыскать требуемый текст, комментарий к тексту, толкование слова (термина), перевод информации с чужого языка на свой или наоборот и т. д. <...> Прикладная лингвистика: направления и методы Термин «прикладная лингвистика» многозначен. <...> В отечественной литературе в качестве синонимов используются термины 8 электронными библиотеками, поисковыми машинами, «компьютерная лингвистика», «вычислительная лингвистика», «автоматическая лингвистика», «инженерная лингвистика. <...> Всё это «узкие» подходы к интерпретации трактовки термина «прикладная лингвистика». <...> Таким образом, прикладная лингвистика (в широком понимании) – раздел языкознания <...>
Информационные_технологии_в_лингвистике.pdf
МИНОБРНАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФГБОУ ВПО «Воронежский государственный университет»
Факультет романо-германской филологии
Кафедра теоретической и прикладной лингвистики
О.М. Воевудская, И.А. Терентьева
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ЛИНГВИСТИКЕ
Учебное пособие для вузов
Издательско-полиграфический центр
Воронежского государственного университета
2012
Стр.1
ВВЕДЕНИЕ
Предлагаемое учебное пособие «Информационные технологии в
лингвистике» предназначено для студентов 1 курса всех форм обучения
факультета романо-германской филологии.
Его цель – приобщить студентов к информационным технологиям в
учебно-образовательной и научно-исследовательской работе. Эта цель
достижима в результате решения нескольких задач:
• показать студенту возможности информационных технологий в
обучении и самообразовании;
студента
• научить
пользоваться
программными
продуктами,
ориентированными на задачи избранной специальности, начиная с
простейших – обработки текста, проверки правописания, использования
электронных словарей и ресурсов библиотек – до более сложных, таких
как программы автореферирования, квантитативные методы обработки
лингвистических данных, поисковые системы, программы машинного
перевода, программы распознавания и синтеза звучащей речи и др.;
• выработать практические навыки обращения к интернет-ресурсам по
гуманитарным дисциплинам;
• использовать полученные знания и навыки при выполнении курсовых, а
затем и выпускной квалификационной работы.
Пособие включает лекции, задания на закрепление пройденного
материала, а также список литературы, которая может быть полезна
студентам при подготовке к экзамену (зачету) по данному курсу.
Особое внимание авторов было направлено на активизацию
мыслительной деятельности студентов, на сознательное и самостоятельное
добывание ими знаний.
3
Стр.3
обучения иностранным языкам................................................................. 92
10.5. Виды обучающих программ........................................................................ 93
10.6. Дистанционное обучение, его особенности, применение
информационных технологий в дистанционном обучении ................... 94
Тема 11. Машинный перевод............................................................................ 97
11.1. Перевод текстов: общие понятия ............................................................... 97
11.2. Виды перевода.............................................................................................. 98
11.3. Причины создания систем машинного перевода...................................... 99
11.4. Преимущества и недостатки машинного перевода................................ 100
11.5. Совершенствование систем машинного перевода ................................. 100
11.6. Классификация систем машинного перевода. Рабочее место
переводчика ............................................................................................... 102
11.7. Обзор некоторых системы машинного перевода ................................... 103
Тема 12. Представление результатов лингвистических исследований. 105
12.1. Представление информации в виде диаграмм, гистограмм, таблиц .... 105
12.2. Создание презентаций в среде PowerPoint .............................................. 108
Литература ........................................................................................................ 110
6
Стр.6
Тема 1: ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ЛИНГВИСТИКА
1. Информационные технологии и причины, способствовавшие их
появлению
2. Прикладная лингвистика: направления и методы
3. Связь функций языка и направлений прикладной лингвистики
4. Методы прикладной лингвистики
5. Компьютерная лингвистика и теория знаний
6. Структуры представления знаний
7. Задачи прикладной лингвистики с использованием информационных
технологий, будущее информационных технологий
§ 1.1. Информационные технологии и причины, способствовавшие их
появлению
До последнего времени мощь любого государства определялась уровнем
развития промышленности, новизной и эффективностью ее технической
базы. Именно с опорой на новейшее техническое оборудование
совершенствовалась технология материального производства.
Под словом технология (от греч. techne ‘искусство, мастерство, умение’
и logos ‘слово, учение’) понимается совокупность методов обработки,
изготовления, изменения свойств, формы и т.д. сырья или материалов,
используемых в процессе производства продукции. Такая технология была
основой индустриального общества.
70-е гг. XX века стали периодом создания персональных компьютеров и
началом развития информационного общества. Основное отличие этого
общества от индустриального заключается в том, что наряду с технологией
материального производства все большую роль начинают играть
информационные технологии (далее – ИТ) как совокупность методов и
средств получения, хранения, преобразования и передачи и информации с
помощью компьютеров.
Появлению и бурному развитию ИТ способствовали следующие
достижения научно-технического прогресса:
1) создание ПК с большой памятью и большой скоростью выполнения
операций;
2) разработка звуковых плат, дающих возможность воспроизводить и
записывать речь, звуки и музыку в большом диапазоне частот;
3) изобретение видеоплат, позволяющих выводить на экран компьютеров
изображение с телеэкранов и видеомагнитофонов;
4) разработка мультимедийных компьютеров, позволяющих воспроизводить
на экране дисплеев цвет, звук, музыку, движение;
5) создание специальных процессоров и устройств, способных передавать
информацию в сети от одного компьютера к другому;
7
Стр.7
6) разработка устройств электронной связи (модемов), позволяющих
передавать информацию на далекие расстояния (по телефонным линиям,
кабелям, радиоканалам и т.п.);
7) создание электронной оргтехники, связанной с ПК и позволяющей
осуществлять высокоскоростную печать документов, их копирование и
размножение.
Конкретизируя определение понятия ИТ по отношению к лингвистике,
можно сказать, что ИТ в лингвистике – это совокупность методов и средств
получения, хранения, преобразования и передачи с помощью компьютеров
информации о языке и законах его функционирования.
«…все существующие и потенциальные ИТ, интересующие
гуманитария, можно разделить на три группы: образовательные
инструментальные и поддерживающие.
Образовательные
информационные технологии
гуманитарий
может
обеспечивают
гуманитарное образование – полное или частичное. Выпускник школы может
с помощью системы дистанционного образования получить специальность
гуманитария. Практикующий
приобрести
дополнительную специальность или сумму новых знаний, повысить
квалификацию путём освоения дистанционного курса по избранной
дисциплине или научной проблеме.
Инструментальные информационные технологии – это набор
компьютерных программ, используемых для решения конкретной научной
проблемы, над которой специалист работает.
Поддерживающие информационные технологии – это совокупность
информационных ресурсов, к которым специалист постоянно обращается за
поддержкой и советом: найти нужную информацию, отыскать требуемый
текст, комментарий к тексту, толкование слова (термина), перевод
информации с чужого языка на свой или наоборот и т. д. Это то, что зовется
порталами,
электронными переводчиками, электронными энциклопедиями и т. д. и т. п.»
[9, c.4].
§ 1.2. Прикладная лингвистика: направления и методы
Термин «прикладная лингвистика» многозначен. В российской и
западной лингвистике он имеет совершенно разные интерпретации. В
западной лингвистике он связывается, прежде всего, с преподаванием
иностранных языков, включая методику преподавания, особенности
описания грамматики для учебных целей, преподавание как родного языка,
так и иностранных, и пр. Это «узкий» подход к пониманию лингвистики, так
называемая applied linguistics.
Другая трактовка данного термина связана с применением компьютеров
для решения практических лингвистических задач. В англоязычной традиции
данному пониманию соответствует термин computational linguistics. В
отечественной литературе в качестве синонимов используются термины
8
электронными библиотеками, поисковыми машинами,
Стр.8