Fix Z-DNA analysis
Děkuji, zjistil jsem, že problém je v originální verzi programu, který z nějakého důvodu nezachycuje Z motivy v krázkých sekvencích (např. 20 mer GC - sekvence GCGCGCGCGCGCGCGCGCGC) - což je samo o sobě divné, protože v originální publikaci popisují, že by nástroj měl zachytit Z motivy o minimální délce 10 párů bazí, tedy GCGCGCGCGC by už měl být pozitivní hit)
Níže uvedený příklad jsem sjel na originálním webu, sekvenci jsem si vymyslel
sekvence CGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGGCGCGCGCGCGCGGCGCGCGCGCGCGCGCGCGCGGCGCGCGCGCGCGCGGCGCGCGCGCGCGCGGCGCGCGCGCGGCGCGCGCGCGGCGCGC
Nástroj nalezl celkem 6 hitů: image.png Zde je první podezřelá věc, proč originální algoritmus, podle kterého děláme náš Z-tracker, neanalyzoval sekvenci od začátku, ale začal až od cca 9./10. nukleotidu? Viz obrázek výše
Další věc je ta, že v dané sekvenci je ve skutečnosti celkem 7 hitů delších nebo rovných 10 bp, proč jich nástroj nalezl jen 6?
Tipuju, že je to tím, že daná sekvence má celkem 180 bp, tedy ten poslední hit, který měl být nalezen, tam už opět není. Závěr je tedy takový, že algoritmus zřejmě prvních a posledních 10 bp sekvence zcela ignoruje :-D Což vysvětluje proč dokonalý 20 mer GC v testování pohořel
- Martin Bartas