Original:http://acgt.cs.tau.ac.il/hyden/HYDEN.htm

HYDEN
Програмне забезпечення для проектування вироджених праймерів

Хаїм Лінхарт і Рон Шамір
Тель-Авівський університет
Оригінальна версія: серпень 2002 року
Останнє оновлення: вересень 2008 року

Огляд

HYDEN (HighlY DEgeNerate праймери) - це програма для проектування пар вироджених праймерів для заданого набору послідовностей ДНК. HYDEN добре працює для великих вхідних наборів геномних послідовностей (наприклад, сотні послідовностей довжиною 1 Кбіт). HYDEN - це пакетна програма (тобто командний рядок, на відміну від графічного інтерфейсу), доступна для Windows XP (версія для завантаження) та Linux (за запитом).

Завантажити

Програмне забезпечення HYDEN вільно доступне для академічного використання - завантажити HYDEN тут .
Він також доступний для неакадемічного використання при відповідному ліцензуванні. Для отримання додаткової інформації зв'яжіться з Ронам Шаміром (rshamir AT post.tau.ac.il) або Хаїмом Лінхартом (chaiml AT post.tau.ac.il).

Вироджені праймери

Праймер вироджується, якщо в деяких його положеннях пропускається більше одного нуклеотиду. Насправді це суміш унікальних праймерів. Наприклад, AAC {G, T} G {A, C, G} G - це 7-довгий вироджений праймер, в якому четверта і шоста позиції вироджуються. Він відповідає праймерам AACGGAG, AACGGCG, AACGGGG, AACTGAG, AACTGCG, AACTGGG.

Виродження праймера - це кількість унікальних послідовностей, яким воно відповідає (6 у прикладі вище). Дегенераційні праймери можна використовувати в реакціях ПЛР для ампліфікації багатьох споріднених послідовностей з геномної ДНК або з бібліотек кДНК. Їх можна використовувати, коли деякі споріднені геномні послідовності невідомі або відомі лише у споріднених видів.

У прикладах пари праймерів із комбінованими поколіннями до 10 10 були успішно використані для ампліфікації послідовностей з геномного фону зі специфічністю понад 99,5% [1].

У наведеному нижче прикладі пара праймерів довжиною 6 охоплює набір з 5 послідовностей.
Зауважте, що між 3 'праймером та четвертою послідовністю існує невідповідність.

Алгоритм

Вхід до HYDEN - це список послідовностей ДНК та набір параметрів, які визначають довжину праймерів, їх максимальне виродження та кількість невідповідностей, які вони можуть мати у кожній послідовності, яку вони охоплюють (тобто теоретично посилюють). HYDEN будує праймери із заданою довжиною та виродженням, які охоплюють багато заданих послідовностей. Це робиться за допомогою 3-фазного алгоритму:

Фаза 1: Знайдіть збережені регіони в послідовностях ДНК, знайшовши незадіяні локальні вирівнювання з низьким показником ентропії.
Фаза 2: Розробити праймери, використовуючи варіанти простих алгоритмів наближення, званих CONTRACTION та EXPANSION (ці алгоритми наближають кількість послідовностей, де праймер не відповідає, за умови, що послідовності над бінарним алфавітом).
Фаза 3: Запустіть жадібну процедуру сходження на пагорб, щоб покращити праймери, і виберіть ту, яка має найбільше покриття як вихід.

HYDEN може сконструювати кілька пар вироджених праймерів, які разом охоплюють багато заданих наборів послідовностей. Після проектування першої пари HYDEN проектує другу пару праймерів на безлічі послідовностей, які не охоплені першою парою. І так далі для решти пар.

Повні деталі алгоритму та відповідний обчислювальний аналіз описані в [2,3] .
HYDEN написаний на C ++ і працює під Windows та Linux.

Використання

HYDEN отримує вхідний файл, який містить набір послідовностей ДНК у форматі fasta, та список параметрів, які визначають довжину праймерів до проектування, їх максимальне виродження та інше. Зразок вхідного файлу HGP_50genes.fasta.txt містить 50 генів нюхових рецепторів людини довжиною ~ 1 Кбіт.

Файл output.txt містить зразок виводу HYDEN для цього вхідного файлу. Вихідні дані показують дві пари праймерів довжиною 25 і виродження ~ 5000 (5 'кінець), ~ 30 000 (3'). Праймери охоплюють 40 з 50 вхідних генів, маючи до 3 невідповідностей (в обох кінцях разом) на покритий ген.

Застосування

HYDEN вивчався та впроваджувався як частина DEFOG - експериментальної схеми дешифрування родин генів [1] . DEFOG надає потужний засіб для аналізу складу великого сімейства генів із збереженими регіонами, а тому особливо корисний для видів, для яких мало геномних даних. Крім того, DEFOG може бути застосований для аналізу бібліотек кДНК сімейства генів.

Враховуючи підмножину відомих послідовностей генів, HYDEN використовується для конструювання вироджених пар праймерів. Потім праймери використовуються в ПЛР-процедурах для ампліфікації фрагментів генів, відомих як і невідомих, того ж сімейства. Фрагменти клонують, а процес олігопечаткового друку (OFP) [4] характеризує клони за їхніми схемами гібридизації з серією дуже коротких (8-мерних) олігонуклеотидів. Картина гібридизації клону називається його відбитком . Інший новий алгоритм, названий CLICK [5] , класифікує клони в групи, що відповідають одному і тому ж генові відповідно до їх відбитків. Нарешті, представники кожного кластеру секвенуються та порівнюються з існуючою базою даних АБО. Нещодавно виявлені послідовності можуть бути використані для проектування пар праймерів для іншого циклу DEFOG.

Схема DEFOG представлена ​​нижче. Цифри під полями підсумовують фактичні параметри нашого експерименту DEFOG на підгеномі людини АБО.

Список літератури

[1] Т. Фукс, Б. Малекова, К. Лінхарт, Р. Шаран, М. Хен, Р. Ервіг, Д. Шмулевич, Р. Елькон, М. Штейнфат, Ж. К. О'Брайен, У. Раделоф, Х. Лехрач, Д Ланс і Р. Шамір, "DEFOG: Практична схема розшифровки сімей генів",
Геноміка , Вип. 80, № 3, с. 295-302, 2002. pdf .
[2] C. Лінхарт та Р. Шамір, "Проблема дизайну вироджених грунтів",
Біоінформатика , Vol. 18, Доп. 1, С. S172-S180, 2002: pdf .
[3] C. Лінхарт та Р. Шамір, "Проблема дизайну вироджених праймерів: теорія та застосування",
JCB , Vol. 12 (4), стор 431-456, 2005: pdf .
[4] U. Radelof, S. Hennig, P. Seranski, M. Steinfath, J. Ramser, R. Reinhardt, A. Poustka, F. Francis, H. Lehrach, «Попередній вибір клонів рушниць олігонуклеотидним відбитком пальців: ефективний та високий Стратегія пропускної спроможності для зменшення надмірності у великих масштабних проектах ",
Дослідження нуклеїнових кислот , Vol. 26, стор 5358-5364, 1998.
[5] Р. Шаран та Р. Шамір, "КЛІК: Алгоритм кластеризації з додатками для аналізу експресії генів",
Зб. 8-а міжнародна конференція з інтелектуальних систем молекулярної біології (ISMB 2000) , стор 307-316, 2000: пс .

На домашню сторінку групи ACGT
Цю сторінку відвідали разів з 8 вересня 2002 року.
Працює на counter.bloke.com