Apakah perbezaan antara fasta dan fastq

Apakah perbezaan antara fasta dan fastq

The Perbezaan utama antara fasta dan fastq adalah bahawa fasta adalah format berasaskan teks yang hanya menyimpan urutan nukleotida atau protein, sementara FastQ adalah format berasaskan teks yang menyimpan kedua-dua urutan dan nilai kualiti urutan yang berkaitan.

Bioinformatik adalah bidang yang menggunakan perisian yang berbeza untuk menganalisis dan memahami data biologi, terutamanya apabila set data adalah kompleks dan besar. Bidang ini menggabungkan biologi, kimia, fizik, sains komputer, kejuruteraan maklumat, matematik, dan statistik untuk menganalisis dan mentafsir data biologi. Fasta dan Fastq adalah dua format perwakilan urutan dalam bidang bioinformatik untuk menyelaraskan dan menganalisis urutan. Malah, FastQ adalah format fail urutan yang memanjangkan format fasta dengan keupayaan untuk menyimpan kualiti urutan.

Kandungan

1. Gambaran Keseluruhan dan Perbezaan Utama
2. Apa itu fasta
3. Apa itu FastQ
4. Persamaan - Fasta dan Fastq
5. Fasta vs fastq dalam bentuk jadual
6. Ringkasan - Fasta vs fastq

Apa itu fasta?

FASTA adalah perisian penjajaran untuk urutan DNA dan protein. Perisian FASTA menggunakan format FASTA. Ia adalah format berasaskan teks yang mewakili urutan nukleotida atau urutan asid amino (protein). Di sini, kod huruf tunggal mewakili kedua -dua urutan ini. Fasta adalah alat penting dalam bidang bioinformatik dan biokimia. Format ini membolehkan nama dan komen urutan untuk mendahului urutan.

Rajah 01: Urutan Fasta

Format ini berasal dari perisian FASTA dan diperkenalkan oleh David J. Lipmann dan William R. Pearson pada tahun 1985. Alat FASTA mempunyai banyak pengubahsuaian dari masa ke masa, dan versi terkini terdiri daripada program untuk protein: protein, DNA: DNA, protein: DNA diterjemahkan (dengan frameshifts) dan carian peptida yang diperintahkan atau tidak teratur. FASTA membaca urutan nukleotida atau asid amino yang diberikan dan mencari pangkalan data urutan yang sepadan dengan menggunakan penjajaran urutan tempatan untuk mencari perlawanan dari urutan pangkalan data yang serupa.

Apa itu FastQ?

FastQ adalah perisian penjajaran yang digunakan dalam bidang bioinformatik, yang menyimpan urutan biologi (biasanya urutan nukleotida) dan skor kualiti yang sepadan. FastQ pada asalnya dibangunkan untuk membungkus urutan fasta yang diformat dan data kualiti yang berkaitan oleh Wellcome Trust Sanger Institute. Dengan perkembangan dalam bidang bioinformatik, FastQ menjadi standard de facto untuk menyimpan output banyak instrumen penjujukan tinggi.

Format FASTQ menggunakan empat baris berbeza setiap urutan. Baris 1 bermula dengan @ aksara dan diikuti dengan pengenal urutan (serupa dengan garis tajuk FASTA). Baris 2 terdiri daripada huruf urutan mentah. Dalam baris 3, urutan bermula dengan watak '+' dan secara pilihan diikuti oleh pengenal urutan yang sama. Baris 4 mengkodekan nilai kualiti untuk urutan dalam baris 2 dan harus terdiri daripada bilangan simbol yang sama seperti huruf dalam urutan.

Apakah persamaan antara fasta dan fastq?

  • FASTA dan FASTQ adalah alat penjajaran.
  • Mereka adalah dua format perwakilan urutan.
  • Kedua -duanya berkaitan dengan bidang bioinformatik.
  • Kedua -dua Fast dan FastQ adalah alat penting untuk tujuan penyimpanan dan penjujukan.
  • FastQ adalah lanjutan dari format FASTA dengan keupayaan untuk menyimpan kualiti urutan.

Apakah perbezaan antara fasta dan fastq?

FASTA adalah format berasaskan teks yang menyimpan hanya nukleotida atau urutan protein, sementara FastQ adalah format berasaskan teks yang menyimpan kedua-dua urutan dan nilai kualiti urutan yang berkaitan. Oleh itu, ini adalah perbezaan utama antara fasta dan fastq. Selain itu, fasta menyimpan serpihan urutan selepas dipetakan, sementara Fastq menyimpan serpihan urutan sebelum pemetaan. Selain itu, satu lagi perbezaan antara Fasta dan Fastq ialah Fasta terdiri daripada satu baris keterangan, dan Fastaq terdiri daripada empat baris.

Infographic di bawah membentangkan perbezaan antara FASTA dan FASTQ dalam bentuk jadual untuk perbandingan bersebelahan.

Ringkasan -Fasta vs fastq

Bioinformatik menggunakan format urutan yang berbeza seperti Fasta dan FastQ, dan lain -lain. Fasta menyimpan serpihan urutan selepas dipetakan sementara Fastq menyimpan serpihan urutan sebelum memetakan. FASTA adalah perisian penjajaran untuk urutan DNA dan protein. Ia terdiri daripada program untuk protein: protein, DNA: DNA, protein: DNA diterjemahkan (dengan frameshifts), dan carian peptida yang diperintahkan atau tidak teratur. FastQ adalah perisian penjajaran yang digunakan dalam bidang bioinformatik dan menyimpan kedua -dua urutan biologi (biasanya urutan nukleotida) dan skor kualiti yang sepadan. Fasta terdiri daripada satu baris keterangan, dan FastQ terdiri daripada empat baris. Oleh itu, ini meringkaskan perbezaan antara FASTA dan FASTQ.

Rujukan:

1. Akalin, Altuna. "Genomik komputasi dengan r."7.1 format fasta dan fastq.
2. "Penerangan format fasta."Pusat Kebangsaan Maklumat Bioteknologi, U.S. Perpustakaan Perubatan Negara.

Ihsan gambar:

1. "Penjajaran Histone" oleh Thomas Shafee - Kerja Sendiri (CC oleh 4.0) melalui Commons Wikimedia