เซ็กซี่บาคาร่า พืชมีจีโนมที่ใหญ่กว่าและซับซ้อนกว่าสัตว์ทุกชนิด ไม่ว่าจะเป็นสัตว์เลี้ยงลูกด้วยนม นก สัตว์เลื้อยคลาน หรือสัตว์ครึ่งบกครึ่งน้ำ ปลาเป็นข้อยกเว้นของกฎดีเอ็นเอของมนุษย์ประกอบด้วยโครโมโซมคู่ฐานประมาณ 3.2 พันล้านคู่กระจายออกไปมากกว่า 23 คู่ของโครโมโซม รวมเป็น 46 โครโมโซม อย่างไรก็ตาม จีโนมของข้าวสาลี (Triticum aestivum)
ประกอบด้วยคู่เบส 17 พันล้านคู่ แบ่งออกเป็นโครโมโซม 21 คู่
(รวม 42 คู่) จีโนมของอ้อย (Saccharum spp.) มีคู่เบส 10 พันล้านคู่ในโครโมโซม 100-130
อ้อยที่ปลูกในปัจจุบันนี้เป็นพันธุ์ลูกผสม (S. hybridum) จากสองสายพันธุ์คือ S. officinarum ซึ่งเป็นอ้อยดั้งเดิมที่ปลูกในอินเดียเมื่อ 3,000 ปีก่อน และ S. spontaneum
“จีโนมอ้อยได้กลายเป็นยักษ์ มันยากมากที่จะทำงานกับมันโดยใช้วิธีจีโนมในปัจจุบัน การถอดรหัสต้องใช้พลังประมวลผลจำนวนมาก มันยากแม้จะใช้คอมพิวเตอร์ล้ำสมัยในแง่ของการประมวลผล และมันมีราคาแพง กล่าวโดยสรุป นี่เป็นความท้าทายสำหรับชีวสารสนเทศ
“เป็นเวลาหลายปีแล้วที่ห้องปฏิบัติการในส่วนต่างๆ ของโลกได้พยายามแต่ล้มเหลวในการสร้างแผนที่จีโนมของอ้อย ความพยายามที่ประสบความสำเร็จครั้งแรกเสร็จสิ้นเมื่อไม่กี่เดือนที่ผ่านมาโดยกลุ่มนักวิจัยในหลายประเทศรวมถึงบราซิล” Carazzolle กล่าว
กลยุทธ์ที่กลุ่มบริษัทนำไปใช้นั้นเกี่ยวข้องกับการคำนวณขนาดใหญ่และการลงทุนจำนวนมากเพื่อจัดลำดับจีโนมทั้งหมด กล่าวคือ คู่เบสทั้งหมด 10 พันล้านคู่
ในบทความที่ตีพิมพ์ในวารสารDNA Research Carazzolle และเพื่อนร่วมงานได้นำเสนอกลยุทธ์ที่แตกต่างออกไปซึ่งมีค่าใช้จ่ายน้อยกว่าและใช้เวลามาก เทคนิคนี้ออกแบบมาเพื่อทำแผนที่ส่วนเฉพาะของจีโนมของพืชโพลีพลอยด์
งานวิจัยบางส่วนที่สนับสนุนนวัตกรรมนี้ดำเนินการสำหรับวิทยานิพนธ์ระดับปริญญาเอกโดยKarina Yanagui de AlmeidaและสำหรับโครงการหลังปริญญาเอกโดยJuliana José ทั้งคู่เป็นนักชีววิทยาที่ IB-UNICAMP และอยู่ภายใต้การดูแลของศาสตราจารย์Gonçalo Amarante Guimarães Pereira สภาแห่งชาติของบราซิลเพื่อการพัฒนาวิทยาศาสตร์และเทคโนโลยี (CNPq) ยังให้ทุนสนับสนุนอีกด้วย
“เราได้พัฒนาซอฟต์แวร์ที่จำเป็นในการสร้างจีโนมที่ซับซ้อนเหล่านี้ขึ้นมาใหม่และนำไปใช้กับอ้อย เราไม่ได้พยายามรวบรวมจีโนมทั้งหมด การศึกษาก่อนหน้านี้กำหนดไว้เพื่อสร้าง DNA ทั้งหมดของพืชขึ้นใหม่ แต่กลยุทธ์ของเราประกอบด้วยการมุ่งเน้นไปที่ส่วนเล็กๆ ที่สัมพันธ์กับประมาณ 1%-2% ซึ่งเป็นตำแหน่งของยีนที่น่าสนใจสำหรับนักปรับปรุงพันธุ์พืช” Carazzolle อธิบาย
กลยุทธ์นี้ช่วยประหยัดลำดับความสำคัญได้อย่างน้อยสองระดับเมื่อเทียบกับเงินหลายสิบล้านดอลลาร์ที่จะทำแผนที่จีโนมทั้งหมด เมื่อโครงการเสร็จสิ้น สมาคมยังไม่ได้ตีพิมพ์ผลงาน ดังนั้นนักพันธุศาสตร์ชาวบราซิลจึงต้องใช้ข้อมูลที่เปิดเผยต่อสาธารณะ เช่น จีโนมของข้าวฟ่าง ข้าว และข้าวโพด ซึ่งเกี่ยวข้องกับอ้อยมากหรือน้อย ค้นหาพื้นที่ที่ต้องการถอดรหัสในบริเวณที่คล้ายคลึงกันของจีโนมอ้อย
การเลือกโดยการเปรียบเทียบเป็นไปได้เพราะหญ้าทั้งหมดมีบรรพบุรุษร่วมกันซึ่งมีอยู่มากกว่า 50 ล้านปีก่อน กล่าวอีกนัยหนึ่ง หลังจากช่วงเวลานี้ ดีเอ็นเอของหญ้าใดๆ ในปัจจุบัน เช่น อ้อย ข้าวสาลี ข้าวฟ่าง ข้าว ข้าวโพด ฯลฯ ยังคงรักษาโครงสร้างแกนเดิมไว้ ควบคู่ไปกับการกลายพันธุ์นับพันล้านครั้งที่เกิดขึ้นตลอดหลายชั่วอายุคน
ตัวประกอบยีน
ผลการวิจัยที่ดำเนินการที่ IB-UNICAMP คือชุดซอฟต์แวร์ที่เรียกว่า Polyploid Gene Assembler (PGA) Carazzolle กล่าวว่า “PGA แสดงถึงกลยุทธ์ใหม่ในการรวบรวมพื้นที่ทางพันธุกรรมโดยอาศัยจีโนมที่ซับซ้อนโดยใช้การจัดลำดับดีเอ็นเอที่มีความครอบคลุมต่ำ
แม้ว่า PGA จะใช้พลังงานคอมพิวเตอร์น้อยกว่า
การประมวลผลขนาดใหญ่ของจีโนมทั้งหมดของโพลีพลอยด์ แต่ระบบขนาดใหญ่มากก็ยังต้องการการรันโปรแกรมในเวลาที่เหมาะสม ในกรณีนี้ นักวิจัยใช้กลุ่มคอมพิวเตอร์ที่เป็นของ Center for Computing in Engineering & Science ( CCES ) ซึ่งเป็นหนึ่งในศูนย์วิจัย นวัตกรรม และการเผยแพร่ ( RIDCsซึ่งได้รับทุนสนับสนุนจาก São Paulo Research Foundation – FAPESP โดย Carazzolle เป็นผู้ตรวจสอบหลักสำหรับ ชีวสารสนเทศที่ CCES
“โครงการนี้จำเป็นต้องใช้คอมพิวเตอร์ประสิทธิภาพสูงของ CCES ที่มีหน่วยความจำเพียงพอ” Carazzolle กล่าว
พวกเขาโหลด PGA ด้วยตำแหน่งยีนที่รู้จักจากฐานข้อมูลจีโนมสาธารณะ ใช้กลยุทธ์การประกอบเพื่อสร้างลำดับจีโนมคุณภาพสูงสำหรับชนิดที่ตรวจสอบ และตรวจสอบขั้นตอนด้วยข้าวสาลี (Triticum aestivum) สปีชีส์ hexaploid โดยใช้ข้าวบาร์เลย์ (Hordeum vulgare) เป็น อ้างอิง. มีการระบุยีนมากกว่า 90% รวมทั้งยีนใหม่หลายตัว
นอกจากนี้ พวกเขายังใช้ PGA เพื่อรวบรวมยีนจากหญ้าสายพันธุ์ S. spontaneum – จัดกลุ่มในสกุลเดียวกันกับอ้อยดั้งเดิม (S. officinarum), S. spontaneum ถูกใช้ในสายเลือดพ่อแม่ของพันธุ์อ้อยลูกผสมที่ปลูกกันอย่างแพร่หลายในปัจจุบัน (S. . ไฮบริดัม).
“เราระบุยีนทั้งหมด 39,234 ยีน โดย 60.4% ของยีนเหล่านี้จัดกลุ่มเป็นตระกูลยีนหญ้าที่รู้จัก ยีนสามสิบเจ็ดตระกูลถูกขยายเมื่อเปรียบเทียบกับหญ้าชนิดอื่น สามมีความโดดเด่นในเรื่องจำนวนสำเนายีนที่อาจเกี่ยวข้องกับการพัฒนาเบื้องต้นและการตอบสนองต่อความเครียด” Carazzolle กล่าว
“การค้นพบของเราสำหรับจีโนมของ S. spontaneum ได้เน้นย้ำถึงพื้นฐานระดับโมเลกุลของลักษณะเฉพาะที่สำคัญบางประการเป็นครั้งแรก เช่น ผลผลิตสูงและความต้านทานต่อความเครียดจากสิ่งมีชีวิตและสิ่งมีชีวิต ผลลัพธ์เหล่านี้สามารถใช้ในการศึกษาหน้าที่และพันธุกรรมในอนาคต อีกทั้งยังจะสนับสนุนการพัฒนาพันธุ์อ้อยพันธุ์ใหม่อีกด้วย
“การใช้ PGA ทำให้เราสามารถจัดเตรียมพื้นที่ของยีนคุณภาพสูงใน T. aestivum และ S. spontaneum ซึ่งพิสูจน์ว่า PGA มีประสิทธิภาพมากกว่ากลยุทธ์ทั่วไปที่ใช้กับจีโนมที่ซับซ้อนและใช้การจัดลำดับดีเอ็นเอที่มีความครอบคลุมต่ำ ความต้องการหน่วยความจำต่ำของ PGA เมื่อเปรียบเทียบกับกลยุทธ์การประกอบแบบเดิมก็เป็นข้อได้เปรียบเช่นกัน”
Carazzolle เน้นว่าถึงแม้จะมีความก้าวหน้าอย่างมากในเทคโนโลยีการจัดลำดับ การรวมกลุ่มของจีโนมที่ซับซ้อนยังคงแสดงถึงคอขวด อันเนื่องมาจากการเกิด polyploidy และ heterozygosity สูง การพัฒนาความพยายามด้านชีวสารสนเทศใหม่สามารถช่วยเอาชนะข้อจำกัดเหล่านี้ โดยเฉพาะอย่างยิ่งในกรณีของจีโนมทั้งหมดของสิ่งมีชีวิตที่เกี่ยวข้องอย่างใกล้ชิด ซึ่งสามารถใช้วิธีการประกอบแบบอ้างอิงอ้างอิงได้
ที่มา: มูลนิธิสนับสนุนการวิจัยของรัฐเซาเปาโล เซ็กซี่บาคาร่า