В.А. Кутыркин, М.Б. Чалей
СТРУКТУРНЫЕ РАЗЛИЧИЯ КОДИРУЮЩИХ
И НЕКОДИРУЮЩИХ РАЙОНОВ
ПОСЛЕДОВАТЕЛЬНОСТЕЙ ДНК ГЕНОМА
ЧЕЛОВЕКА
Проведен количественный анализ регулярных структурных
свойств кодирующих и некодирующих районов последовательностей генома человека. <...> В них выявлена двухуровневая организация кодирования генетической информации. <...> E-mail: vkutyrkin@yandex.ru, maramaria@yandex.ru
Ключевые слова: скрытая периодичность, скрытая профильность, спектрально—статистический подход, распознавание кодирующих районовДНК
Современные технологии секвенирования геномов различных организмов позволили представить полимерные молекулы ДНК B виде
текстовых строк B алфавите из четырех букв (А, Т, G, C), соответствующих четырем типам мономерных звеньев ДНК — четырем нуклеотидам (нукл.) <...> В текстовых последовательностях ДНК находятся так называемые кодирующие районы, транслируемые B соответствующие последовательности белков. <...> Выявление кодирующих
районов является одной из актуальных проблем генетического анализа
последовательностей ДНК. <...> Ранее в литературе отмечалась регулярность структурной организации последовательностей кодирующих районов ДНК, которая эпизодически выявлялась в спектрах корреляционных функций, в спектрах Фурье и т. п. <...> Настоящая работа направлена на достоверное выявление в кодирующих районах последовательностей ДНК
характерной регулярности, позволяющей отличить их от некодирующих районов. <...> Для этого используется ранее предложенный спектрально-статистический подход [#6], разработанный для распознавания нового типа скрытой периодичности в ДНК — профильной периодичности (профильности). <...> Понятие скрытой профильности [7] расширяет известное понятие
размытого тандемного повтора [8], которое применялось ранее для
распознавания скрытой периодичности в последовательностях ДНК. <...> Совершенный тандемный повтор является текстовой строкой, которая получена последовательными копиями его подстроки, называемой <...>