چگونه می توان با استفاده از Biopython ، دنباله ژن را از Entrez دریافت کرد؟

برای بازیابی دنباله ژن از پایگاه داده NCBI ENTREZ با استفاده از Biopython ، می توانید از ماژول Entrez از بسته BIO استفاده کنید. در زیر یک راهنمای گام به گام در مورد نحوه انجام این کار آورده شده است:
مرحله 1: Biopython را نصب کنید
اگر قبلاً Biopython را نصب نکرده اید ، می توانید این کار را با استفاده از PIP انجام دهید:
pip install biopython
مرحله 2: ماژول های لازم را وارد کنید
شما باید ماژول Entrez را از Biopython وارد کنید.
from Bio import Entrez
مرحله 3: ایمیل خود را تنظیم کنید
NCBI از شما خواسته است هنگام استفاده از خدمات ENTREZ ، آدرس ایمیل ارائه دهید.
Entrez.email = "your_email@example.com" # Replace with your email
مرحله 4: ژن را جستجو کنید
برای جستجوی ژن مورد علاقه از تابع entrez.esearch استفاده کنید. به عنوان مثال ، بیایید ژن انسولین انسانی (INS) را جستجو کنیم.
search_term = "INS[Gene Name] AND Homo sapiens[Organism]"
handle = Entrez.esearch(db="nucleotide", term=search_term)
record = Entrez.read(handle)
handle.close()
مرحله 5: دنباله ژن را بازیابی کنید
پس از داشتن لیست شناسه ها از جستجو ، می توانید از Entrez.efetch برای بازیابی دنباله استفاده کنید.
gene_id = record["IdList"][0] # Get the first ID from the search results
handle = Entrez.efetch(db="nucleotide", id=gene_id, rettype="fasta", retmode="text")
gene_sequence = handle.read()
handle.close()
مرحله ششم: دنباله را چاپ یا ذخیره کنید
اکنون می توانید دنباله ژن را چاپ یا ذخیره کنید.
print(gene_sequence)
# Optionally, save to a file
with open("gene_sequence.fasta", "w") as file:
file.write(gene_sequence)
کد کامل مثال
در اینجا کد کامل وجود دارد:
from Bio import Entrez
# Set your email
Entrez.email = "your_email@example.com"
# Search for the gene
search_term = "INS[Gene Name] AND Homo sapiens[Organism]"
handle = Entrez.esearch(db="nucleotide", term=search_term)
record = Entrez.read(handle)
handle.close()
# Retrieve the gene sequence
gene_id = record["IdList"][0] # Get the first ID from the search results
handle = Entrez.efetch(db="nucleotide", id=gene_id, rettype="fasta", retmode="text")
gene_sequence = handle.read()
handle.close()
# Print or save the sequence
print(gene_sequence)
# Optionally, save to a file
with open("gene_sequence.fasta", "w") as file:
file.write(gene_sequence)
یادداشت ها:
پایگاه داده (DB): پارامتر DB در Entrez.esearch و Entrez.efetch می تواند بسته به آنچه به دنبال آن هستید ، روی پایگاه داده های مختلف مانند نوکلئوتید ، پروتئین ، ژن و غیره تنظیم شود.
محدود کردن نرخ: به محدودیت نرخ NCBI توجه داشته باشید. اگر درخواست های زیادی را انجام می دهید ، از entrez.sleep استفاده کنید تا بین درخواست ها مکث کنید.
این کد دنباله ژن را با فرمت Fasta واگذار می کند و آن را چاپ می کند یا آن را در یک پرونده ذخیره می کند.