E D R , A S I H C RSS

Bioinformatics


1. μ†Œκ°œ


  • 이름 : Bioinformatics
  • μ°Έμ—¬ : 정희둝
  • κΈ°κ°„ : 2002. 3. 14 ~ 2002.8.xx
  • ν”„λ‘œμ νŠΈ μ‹œμž‘λ™κΈ°μ™€ λͺ©μ  : λ³Έ μ—°κ΅¬λŠ” μ°¨μ„ΈλŒ€ BioκΈ°μˆ μ—μ„œ 컴퓨터 μ „κ³΅μžλ‘œμ„œ μ ‘κ·Όν•  수 μžˆλŠ” 기술인 Bioinformatics에 λŒ€ν•œ κΈ°μ΄ˆλΌ λ‹¦λŠ” 것을 λͺ©μ μœΌλ‘œ ν•œλ‹€.
  • ν”„λ‘œμ νŠΈ 진행 : ꡐ재의 정리와 κ΄€λ ¨ μ›Ήμ‚¬μ΄νŠΈμ˜ 링크, κ΄€λ ¨ λ¬Έμ„œ μ •λ¦¬λΌ μ£ΌμΆ•μœΌλ‘œ ν•˜κ² μŠ΅λ‹ˆλ‹€. λ‹¨μˆœ λ²ˆμ—­λ³΄λ‹€λŠ” 의λΈμžˆλŠ” μž¬μ •λ¦¬ 과정에 λ…Έλ ₯을 기울일 μ˜ˆμ •μž…λ‹ˆλ‹€.
  • ꡐ재 : β€œBioinformatics: A practical guide to the analysis of genes and proteins”, Second Edition edited by Baxevanis & Ouellette

2. 책정리


2.1. NCBI DataModel

μ™œ Model을 μ΄μš©ν•˜λŠ”κ°€? μ‹€μ œμ— κ°€κΉŒμš΄ λͺ¨λΈμ€ μ‹€μ œλ‘œ μΌμ–΄λ‚˜λŠ” 일을 보닀 더 잘 μ΄ν•΄μ‹œν‚€κ³  μ˜ˆμΈ‘κ°€λŠ₯ν•˜κ²Œ ν•œλ‹€.
이런 μ·¨μ§€μ—μ„œ NCBIλŠ” sequence-related information에 κ΄€ν•œ λͺ¨λΈμ„ λ§Œλ“€μ—ˆλ‹€. 그리고 이런 λͺ¨λΈμ„ μ΄μš©ν•΄μ„œ Entrez(data retrieval system)λ‚˜ GenBank DB(DNA seq.λΌ μ €μž₯ν•΄λ‘” DB, 두 κ°€μ§€λŠ” μœ μ „μž μ—°κ΅¬μ˜ μ€‘μš”ν•œ data듀이닀.)와 같이 μ†Œν”„νŠΈμ›¨μ–΄λ‚˜ 톡합 DBμ‹œμŠ€ν…œμ„ κ°€λŠ₯ν•˜κ²Œ λ§Œλ“€μ—ˆλ‹€.

=== GenBank flatfile & format VS NCBI data model===
GenBank flatfile은 DNA-centered의 λ³΄κ³ μ„œμ΄λ‹€. DNAμ€‘μ‹¬μ΄λΌλŠ” 것은 μ–΄λ–€ λ‹¨λ°±μ§ˆμ˜ μœ μ „μž μ •λ³΄λΌ μ €μž₯ν•˜κ³  μžˆλŠ” DNAμ˜μ—­μ΄ DNAμœ„μ˜ coding region이라고 λΆˆλ¦°λ‹€. λ°˜λŒ€λ‘œ λŒ€λΆ€λΆ„μ˜ Protein seq. DB듀은 Protein-centered의 관점이며, μ΄λŠ” λ‹¨λ°±μ§ˆκ³Ό μœ μ „μž μ‚¬μ΄λŠ” accesion number(μœ μ „μžλΌ μ ‘κ·Όν•˜κΈ°μœ„ν•œ DB의 keyκ°’) ... 진행쀑

3. μš©μ–΄ μ°Έμ‘°

3.1. NCBI λž€

National Center for Biotechnology Information λΆ„μž 생물 μ •λ³΄λΌ λ‹€λ£¨λŠ” ꡭ가적인 μžλ£Œμ›μœΌλ‘œμ„œ μ„λ¦½λ˜μ—ˆμœΌλ©°, NCBIλŠ” 곡용 DBλΌ λ§Œλ“€λ©°, 계산에 κ΄€ν•œ 생물학에 μ—°κ΅¬λΌ μ΄λŒκ³  있으며, Genome μžλ£ŒλΌ λΆ„μ„ν•˜κΈ° μœ„ν•œ software λ„κ΅¬λΌ κ°œλ°œν•˜κ³ , 생물학 μ •λ³΄λΌ λ³΄κΈ‰ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. - 즉, μΈκ°„μ˜ 건강과 μ§ˆλ³‘μ— 영ν–₯을 λΈμΉ˜λŠ” λΈμ„Έν•œ 과정듀을 보닀 더 잘 μ΄ν•΄ν•˜κΈ° μœ„ν•œ λͺ¨λ“  ν™œλ™μ„ μˆ˜ν–‰

Established in 1988 as a national resource for molecular biology information, NCBI creates public databases, conducts research in computational biology, develops software tools for analyzing genome data, and disseminates biomedical information - all for the better understanding of molecular processes affecting human health and disease.

3.2. Entrez λž€

EntrezλŠ” 톡합 λ°μ΄ν„°λ² μ΄μŠ€ retrieval μ‹œμŠ€ν…œμœΌλ‘œμ„œ DNA, Protein, genome mapping, population set, Protein structure, λ¬Έν—Œ 검색이 κ°€λŠ₯ν•˜λ‹€. Entrezμ—μ„œ Sequence, 특히 Protein SequenceλŠ” GenBank protein translation, PIR, PDB, RefSeqλΌ ν¬ν•¨ν•œ λ‹€μ–‘ν•œ DB듀에 μžˆλŠ” μ„œμ—΄μ„ 검색할 수 μžˆλ‹€.
...진행쀑

4. μƒλ¬Όν•™κΈ°μ΄ˆ

4.1. λ‰΄ν΄λ ˆμ˜€ν‹°λ“œ(nucleotide)λž€

DNA와 RNAλΌ κ΅¬μ„±ν•˜λŠ” nucleotideλŠ” 인산기(Phophate), 5 탄당(Sugar)인 λ””μ˜₯μ‹œλ‘œλ³΄μŠ€(deoxyribose), 4 μ’…λ₯˜μ˜ μ§ˆμ†Œ μ—ΌκΈ°(Base) 쀑 ν•˜λ‚˜λΌ ν¬ν•¨ν•˜μ—¬ 3개의 λΆ€μœ„(Phophate, Sugar, Base)둜 κ΅¬μ„±λœ λ¬Όμ§ˆμ΄λ‹€. 당은 인산과 μ—ΌκΈ°λΌ μ—°κ²°μ‹œν‚¨λ‹€. (μš©μ–΄μ„λͺ…. 쀑합 : λ§Žμ€ λΆ„μžκ°€ κ²°ν•©ν•˜μ—¬ 큰 λΆ„μžλŸ‰μ˜ ν™”ν•©λ¬Όλ‘œ λ˜λŠ” λ³€ν™”)
μΈμ‚°κΈ°λŠ” ATP에(κ·Όμœ‘μ€ 이 ATPλΌ μ†ŒλΉ„ν•΄μ„œ μ—λ„ˆμ§€λΌ λ‚Έλ‹€. μΌμ’…μ˜ μ—λ„ˆμ§€μ›.) μžˆλŠ” 잘 μ•Œλ €μ§„ 산성기이닀. DNA λΆ„μžλΌ κ΅¬μ„±ν•  λ•Œμ—λŠ” 당에 직접 μ—°κ²°λœ ν•˜λ‚˜μ˜ μΈμ‚°κΈ°λ§Œ λ‚¨λŠ”λ‹€. 5 탄당 λ””μ˜₯μ‹œλ‘œλ³΄μŠ€(deoxyribose)λŠ” ATP의 5 탄당 리보슀(ribose)와 맀우 μœ μ‚¬ν•˜λ‹€. deoxyriboseλŠ” ribose의 2번 νƒ„μ†Œμ— μžˆλŠ” -OH κΈ° λŒ€μ‹  -HκΈ°λΌ κ°€μ§€κ³  μžˆλ‹€. deoxyribose의 5개 νƒ„μ†Œμ—λŠ” 1λ²ˆμ—μ„œ 5λ²ˆκΉŒμ§€ μˆ«μžκ°€ 뢙여진닀.

DNA에 μ‘΄μž¬ν•˜λŠ” 4μ’…λ₯˜μ˜ μ—ΌκΈ°λŠ” μ•„λ°λ‹Œ(adenine), κ΅¬μ•„λ‹Œ(guanine), ν‹°λΌ(thymine), μ‹œν† μ‹ (cytosine), μš°λΌμ‹€(uracil)이닀. 이듀 μ€‘μ—μ„œ 피리λΈλ”˜(pyrimidine)이라고 λΆ€λ₯΄λŠ” thymine, cytosine, uracil은 μ§ˆμ†Œμ™€ νƒ„μ†Œλ‘œ κ΅¬μ„±λœ 6κ°ν˜•μ˜ 고리둜 λ˜μ–΄ μžˆλ‹€. 퓨린(purine)이라고 λΆ€λ₯΄λŠ” adenine, guanine은 더 λ³΅μž‘ν•˜μ—¬, μ§ˆμ†Œμ™€ νƒ„μ†Œλ‘œ κ΅¬μ„±λœ 6κ°ν˜•κ³Ό 5κ°ν˜•μ˜ 이쀑 고리둜 이루어진닀. nucleotideμ—μ„œ 이듀 염기듀은 deoxyribose의 1번 νƒ„μ†Œμ— κ³΅μœ κ²°ν•©μœΌλ‘œ μ—°κ²°λ˜μ–΄ 있으며, μΈμ‚°κΈ°λŠ” 5번 νƒ„μ†Œμ— μ—­μ‹œ κ³΅μœ κ²°ν•©μœΌλ‘œ μ—°κ²°λ˜μ–΄ μžˆλ‹€. adenine, guanine, cytosine, thymine, uracil은 각각 A, G, C, T,U 둜 ν‘œκΈ°λœλ‹€.<κ·Έλ¦Ό 1>

4.2. DNA VS RNA

ν•΅μ‚°(Nucleic acid)λΆ„μžλŠ” λΏμ„ 수 없을 μ •λ„λ‘œ κΈ΄ 쀑합체이며, 각 λΆ„μžλŠ” ꡬ쑰 λ‹¨μœ„μΈ nucleotideλΌ μˆ˜λ°±λ§Œ κ°œμ”© 포함 ν•˜κ³  μžˆλ‹€.
Nucleic acidλŠ” base의 μ’…λ₯˜μ™€ 5-carbon sugar의 μ’…λ₯˜, λΆ„μž ꡬ쑰에 따라 DNA와 RNA둜 λΆ„λ₯˜λœλ‹€.
ν•΅μ‚°μ—ΌκΈ°μ˜ μ’…λ₯˜„΄λ‹Ήμ˜ μ’…λ₯˜λΆ„μž ꡬ쑰
DNAA, G, C, TDioxyribose2쀑 λ‚˜μ„ 
RNAA, G, C, URibose단일 μ‚¬μŠ¬

4.3. DNA

이 그림은 DNA의 λͺ¨μ‹λ„이닀.
DNAλŠ” a twisted ladder라고 ν‘œν˜„λ˜λŠ”λ° μ‚¬λ‹€λ¦¬μ˜ 각각의 strandλŠ” λ‹Ήκ³Ό μΈμ‚°μ˜ 결합을 의λΈν•˜κ³ , lung은 Baseλ“€μ˜ 결합을 의λΈν•œλ‹€. Base듀은 μ‚¬μ΄μ˜ 결합은 μˆ˜μ†Œκ²°ν•©μ„ μ΄λ£¨λŠ”λ°, A와 T, C와 Gκ°€ 결합이 이루어진닀. λ”°λΌμ„œ DNAλΌ λΆ„μ„ν•΄ baseλ“€μ˜ μˆ˜λΌ λΉ„κ΅ν•΄λ³΄λ©΄ A와 T의 μˆ˜κ°€ κ°™κ³ , C와 G의 μˆ˜κ°€ κ°™μŒμ„ μ•Œ 수 μžˆλ‹€. 이에 ν•œμͺ½ κ°€λ‹₯에 μžˆλŠ” nucleotideλŠ” λ‹€λ₯Έμͺ½ κ°€λ‹₯의 nucleotide μ„œμ—΄μ„ κ²°μ •ν•˜κ²Œ λœλ‹€. κ·Έλž˜μ„œ κ·Έ 두 κ°€λ‹₯을 상보적 (complementary) 이라고 ν•œλ‹€. 즉, DNA λΆ„μžλΌ μˆ˜μ§μœΌλ‘œ 그리면 ν•œ κ°€λ‹₯은 5'μ—μ„œ 3'으둜 μœ„μ—μ„œ μ•„λž˜λ‘œ 달리고, λ‹€λ₯Έ κ°€λ‹₯은 5'μ—μ„œ 3'으둜 μ•„λž˜λ‘œ μœ„λ‘œ 달린닀.(5', 3' νš¨μ†ŒλΌκ³  μ•Œκ³  있음, μ •ν™•νžŒ λͺ¨λ¦„)

4.4. DNA Republication

μ™“μŠ¨κ³Ό 크릭은 DNA의 ꡬ쑰, 특히 μŒμ„ 이룬 nucleotide의 상보성이 μœ μ „λ¬Όμ§ˆμ˜ μ •ν™•ν•œ λ³΅μ œκΈ°μž‘μ˜ ν•΅μ‹¬μž„μ„ μ•Œμ•˜λ‹€. 그듀은 "μš°λ¦¬κ°€ κ°€μ •ν•œ μ—ΌκΈ°μŒ ν˜•μ„±μ›λ¦¬κ°€ μœ μ „ 물질의 λ³΅κΈ°μž‘μ„ μ œμ‹œν•˜κ³  μžˆμŒμ„ λŠλ‚„ 수 μ΄μ—ˆλ‹€."라고 λ§ν•˜μ˜€λ‹€. 그듀은 이쀑 λ‚˜μ„ μ˜ 두 κ°€λ‹₯이 λΆ„λ¦¬λ˜κ³  κ·Έ 각각의 κ°€λ‹₯을 μ£Όν˜• (template)으둜 ν•˜μ—¬ μƒˆλ‘œμš΄ 상보적 μ‚¬μŠ¬μ΄ ν˜•μ„±λœλ‹€λŠ” λ‹¨μˆœν•œ 볡제λͺ¨λΈμ„ λ§Œλ“€μ—ˆλ‹€.

4.5. DNA의 μ—Όμƒ‰μ²΄λ‚΄μ—μ„œμ˜ νŽΈμ„±(Organization)

μΈκ°„μ˜ 염색체(chromosome)의 μ’…λ₯˜λŠ” 23κ°œμ΄λ‹€. 22κ°œλŠ” 상염색체(autosome)이고 1κ°œλŠ” 성염색체(sex chromosome)이닀. ν•œ μ’…λ₯˜μ˜ μ—Όμƒ‰μ²΄λŠ” μ„œλ‘œμ˜ μŒμ„ 가지고 μžˆλ‹€. λ”°λΌμ„œ μΈκ°„μ˜ 염색체ꡰ(genome)은 46개의 chromosome으둜 κ΅¬μ„±λ˜μ–΄ μžˆλ‹€. chromosome은 μ„Έν¬λ‚΄μ—μ„œ λŒ€λΆ€λΆ„μ˜ μ‹œκ°„μ„ μ‹€νƒ€λž˜(fiber)같은 ν˜•νƒœλ‘œ μžˆλŠ”λ°.. μ΄λŠ” chromosome κΈ°λ³Έλ‹¨μœ„μΈ λ‰΄ν΄λ ˆμ˜€μ†œ(Nucleosome)듀이 κ²°ν•©λœ ν˜•νƒœμ΄λ‹€. 이 nucleosome은 ν•˜λ‚˜μ˜ νžˆμŠ€ν†€(histone)λ‹¨λ°±μ§ˆμ„ DNAκ°€ λ‘λ²ˆ νœ˜κ°μ€ ν˜•νƒœμ΄λ‹€. --μž‘μ„±μ€‘

4.6. Geneλž€

μœ μ „ ν˜•μ§ˆμ„ λ§ν•˜λ©° μœ μ „μ— κ΄€μ—¬ν•˜λŠ” νŠΉμ • λ¬Όμ§ˆμ΄λ‹€. Gene의 λͺ¨μž„이 Genome이닀. λ˜ν•œ 이 GeneλŠ” DNA에 κ·Έ λ‚΄μš©μ΄ μ•”ν˜Έν™” λ˜μ–΄ μžˆλ‹€. μ΄λΈ μ•Œκ³  μžˆμ„μ§€λ„ λͺ¨λ₯΄κ² μ§€λ§Œ, Geneμ΄λΌλŠ” 것은 DNA의 μ—ΌκΈ° 배열이닀. 이 μ—ΌκΈ° λ°°μ—΄(base sequence)이 μ–΄λ–€ 과정을 ν†΅ν•΄μ„œ λŒ€μ‘λ˜λŠ” μˆœμ„œλ‘œ μ•„λΈλ…Έμ‚°(amino acid)끼리의 peptide결합을 ν•˜μ—¬ λ‹¨λ°±μ§ˆλ‘œ λ‚˜νƒ€λŠ” 것을 μœ μ „ ν˜•μ§ˆ λ°œν˜„μ΄λΌκ³  ν•œλ‹€.
μš°μ„  μƒλ¬Όν•™μ˜ 핡심 이둠이 Central Dogma(쀑심이둠)에 λŒ€ν•΄ μ•Œμ•„λ³΄κ² λ‹€.
이 이둠은 DNAκ°€ μ–΄λ–»κ²Œ λ‹¨λ°±μ§ˆμ„ μƒμ„±ν•˜λŠ” κ°€λΌ λ³΄μ—¬μ£Όκ³  μžˆλ‹€.
κ·Έλ¦Ό. 1
κ·Έλ¦Ό 1을 μ°Έμ‘°ν•˜λ©΄ DNAλŠ” 2쀑 λ‚˜μ„ ν˜• ꡬ쑰둜 λ˜μ–΄μžˆλ‹€. 이것이 세포 λΆ„μ—΄ κ³Όμ •μ—μ„œ DNA에 μœ μ „μ•”ν˜ΈλΌ λ³΅μ‚¬ν•œ mRNA둜 λ°”λ€Œλ©° 이 mRNAκ°€ Ribosome에 λ“€μ–΄κ°€λ©΄ tRNAλŠ” mRNA에 λ‹΄κ²¨μžˆλŠ” DNAμœ μ „μ•”ν˜ΈλΌ λΆ„μ„ν•˜μ—¬μ„œ λŒ€μ‘λ˜λŠ” amino acidλΌ κ°€μ Έμ˜¨λ‹€. 이런 과정이 반볡되고, amino acidμ‚¬μ΄μ—λŠ” peptide결합을 μ΄λ£¨λ©΄μ„œ μ΄λŠ” λ‹¨λ°±μ§ˆλ‘œ ν˜•μ§ˆ λ°œν˜„μ΄ λœλ‹€. -- 진행쀑..

BioinformaticsλΌ κ³΅λΆ€ν•˜λ €λŠ” μ‚¬λžŒλ“€μ„ μœ„ν•΄

μ ˆλŒ€ 컴퓨터 μ§€μ‹λ§ŒμœΌλ‘œ μŠΉλΆ€κ±Έλ €κ³  ν•˜μ§€ 말아야 ν•  것 μž…λ‹ˆλ‹€. 컴퓨터 μ§€μ‹λ§ŒμœΌλ‘œλŠ” 정말 기술자 μˆ˜μ€ λ°–μ— λ˜μ§€ λͺ»ν•©λ‹ˆλ‹€. κ·Έμͺ½ 지식이 ν•„μš”ν•˜λ‹€κ³  해도 이건 기술적 μ§€μ‹μ΄λΌκΈ°λ³΄λ‹€λŠ” κ³Όν•™, 즉, μ „μ‚°ν•™(Computer Science)의 지식이 ν•„μš”ν•©λ‹ˆλ‹€. 그리고 BioinformaticsλΌ μ œλŒ€λ‘œ κ³΅λΆ€ν•˜λ €λ©΄ 컴퓨터 λΆ„μ•ΌλΌ λΉΌκ³ λ„ μ΅œμ†Œν•œ 생물학 개둠, λΆ„μž 생물학, 생화학, μœ μ „ν•™, 톡계학 개둠, ν™•λ₯ λ‘ , λ‹€λ³€λŸ‰ 톡계학, λΈμ λΆ„을 μ•Œμ•„μ•Ό ν•©λ‹ˆλ‹€. 이런 것을 λͺ¨λ₯΄κ³  λ›°μ–΄λ“€κ²Œ 되면 κ°€μž₯자리만 맴돌게 λ©λ‹ˆλ‹€. κ΅­λ‚΄μ—μ„œ BioinformaticsλΌ ν•˜λ €λŠ” λŒ€λΆ€λΆ„μ˜ μ „μ‚°ν•™κ³Ό κ΅μˆ˜λ‹˜λ“€μ΄ 이 λΆ€λ₯˜μ— μ†ν•œλ‹€λŠ” 점이 μ„œκΈ€ν”ˆ 사싀이죠.

μ œλŒ€λ‘œ 된 μ•ˆλ‚΄λΌ λ°›μœΌλ €λ©΄, 원세연 λ°•μ‚¬λ‹˜μ˜ μ‚¬μ΄νŠΈλΌ μΆ”μ²œν•©λ‹ˆλ‹€. http://www.bioinformatics.pe.kr/ -- κΉ€μ°½μ€

DeleteMe QnAλΌ μ½μ–΄ λ³΄μ•˜λŠ”λ° μžμ‹ κ°μ΄ '뚝' λ–¨μ–΄μ§€λŠ”κ΅°μš”.(μ΄κ²ƒλ§Œμ΄ μ•„λ‹ˆμ–΄λ‘ 였늘 κ΅μž¬λΌ λ³΄λŠ”λ° μ²˜μŒλ³΄λŠ” μƒμ†Œν•œ 단어듀 λ•Œλ¬Έμ— 사전 찾으랴, μ‚¬μ΄νŠΈ λŒμ•„λ‹€λ‹ˆλ©° μ–΄λ–€ 건지 μ•Œμ•„λ³΄λž΄, ν•΄λ§ΈλŠ”λ°..) κ·Έλž˜λ‘, 이름을 μ„Έλ²ˆμ΄λ‚˜ ν‹€λ¦° 이 학문이 λ­”μ§€λŠ” μ•Œκ³  μ‹Άκ³ ,:) λ‹€μŒμ— ν˜Ήμ‹œ 저와 λΉ„μŠ·ν•œ μ§€μ‹λ§Œ 가진 μ‚¬λžŒμ΄ 이μͺ½μ— 관심을 가지고 μ—°κ΅¬λΌ ν•  λ•Œ 도움이 될 수 μžˆμ—ˆμœΌλ©΄ ν•©λ‹ˆλ‹€.

DeleteMe μ–΄μ„œ ν”„λ‘œμ νŠΈλΌ ν• μ •λ„μ˜ μ„±κ³ΌλΌ λ§Œλ“€μ–΄μ•Όκ² κ΅°μš”.

Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2021-02-07 05:22:36
Processing time 0.0356 sec