Sunday, 15 January 2012

perl - get a specific sequence from a fasta file with Regex -


मैं n th अनुक्रम (या अधिमानतः n th < एक इनपुट फ़ास्टा फ़ाइल से आदर्श रूप से, यूनिक्स "एक-लाइनर" के साथ।

मुझे पता है कि मैं पर्ल के साथ अनुक्रम पढ़ सकता / सकती हूं (या कोई अन्य) पटकथा भाषा), गिनते हैं, और फिर अनुक्रम मुद्रित करते हैं, लेकिन मैं कुछ तेज और अधिक कॉम्पैक्ट की तलाश कर रहा हूं।

उन लोगों के लिए, एक नमूना फास्ट फ़ाइल निम्न की तरह दिखती है:

 <कोड> & gt; SEQUENCE_1 MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG LVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHK IPQFASRKQLSDAILKEAEEKIKEELKAQGKPEKIWDNIIPGKMNSFIADNSQLDSKLTL MGQFYVMDDKKTVEQVIAEKEKEFGGKIKIVEFICFEVGEGLEKKTEDFAAEVAAQL & gt; SEQUENCE_2 SATVSEINSETDFVAKNDQFIALTKDTTAHIQSNSLQSVEELHSSTINGVKFEEYLKSQI ATIGENLVVRRFATLKAGANGVVNGYIHTNGRVGVVIAAACDSAEVASKSRDLLRQICMH    

एक जिस तरह से awk के साथ:

  awk -v R एस = '& gt;' -v प्रारंभ = $ n -v अंत = $ m 'NR & gt; = (प्रारंभ + 1) & amp; amp; और एनआर & amp; लिफ्ट; = (अंत + 1) {प्रिंट "& gt;" $ 0}' फास्टा_फ़ाइल    

No comments:

Post a Comment