編碼區
基因的編碼區(英語:Coding region),亦稱為「編碼序列」(Coding sequence)或「CDS」(Coding DNA Sequence),是指DNA或RNA中由外顯子組成,編碼蛋白質的部分。該區域的邊界範圍從靠近5′末端的起始密碼子開始,到靠近3′末端的終止密碼子為止。mRNA的編碼區範圍位於5′非翻譯區和部分同樣為外顯子的3′非翻譯區之間。[1]
某個生物體的編碼區是指該生物由基因編碼區組成的基因組的總和。[2]
編碼序列注釋
雖然識別DNA序列內的開放閱讀框簡單明了,但識別編碼序列卻並非如此,因為細胞只會把所有開放閱讀框的一部分翻譯為蛋白質。[3]目前CDS預測通過對細胞mRNA取樣測序完成,但要判斷給定mRNA究竟哪一部分實際翻譯為了蛋白質,目前仍是問題。CDS預測屬於基因預測的一部分,後者不僅包括對編碼蛋白質的DNA序列預測,也包括對其它功能元件,如RNA基因和調節序列的預測。
參見
參考文獻
- ^ Twyman, Richard. Gene Structure. The Wellcome Trust. 1 August 2003 [6 April 2003]. (原始內容存檔於2007年3月28日).
- ^ Goto, Mami; et al. Analysis of CpG Dinucleotide Frequency in Bacterial Genomes with Respect to Genomic Regions and Codon (PDF). The Fourth Annual International Conference on Computational Molecular Biology, Tokyo, Japan. April 8, 2000 [6 April 2009]. (原始內容 (PDF)存檔於2003年6月22日).
- ^ Furuno, Masaaki; Kasukawa, Takeya; Saito, Rintaro; Adachi, Jun; Suzuki, Harukazu; Baldarelli, Richard; Hayashizaki, Yoshihide; Okazaki, Yasushi. CDS Annotation in Full-Length cDNA Sequence (PDF). Genome Research (Cold Spring Harbor Laboratory Press). September 2011, 21 (9): 1478–1487 [18 September 2011]. doi:10.1101/gr.1060303. (原始內容 (PDF)存檔於2019-10-01).