معلومة

أداة محاكاة تطور التسلسل

أداة محاكاة تطور التسلسل


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أبحث عن أداة لمحاكاة تطور التسلسل بالنظر إلى نموذج الطفرة المحدد ونموذج الوفاة عند الولادة. أنا على دراية بالأدوات والحزم مثل INDELible و Seq-Gen و PhyloSim ، لكنها تحاكي التطور على طول أشجار النشوء والتطور. ما أريده هو إعطاء تسلسل وأطلب من الأداة محاكاة تطور هذا التسلسل عبر الأجيال N. يجب أن يكون الناتج مجموعة كبيرة من المتواليات التابعة. كنت أفكر في كتابة مثل هذه الأداة بنفسي ، لكن من الأفضل دائمًا البحث عن شيء مشفر بالفعل.


توجد مجموعة من علم الوراثة السكانية إلى الأمام والخلف (اندماج) منصات محاكاة. فيما يلي قائمة غير شاملة. كلهم مختلفون وسيتعين عليك مراجعة دليلهم لمعرفة ما هو أكثر ملاءمة لاحتياجاتك.

قائمة البرامج

هنا قائمة طويلة من هذه المنصات. قد تكون القائمة قديمة بعض الشيء اليوم على الرغم من أن العديد من هذه البرامج قد تكون بطيئة أو تم التخلي عنها من قبل مؤلفيها.

البرامج الأكثر شيوعًا في تجربتي

البعض معروف أكثر من البعض الآخر. أنا شخصياً رأيت بالفعل استخدامات الأنظمة الأساسية التالية في النشر: SimCoal و Nemo و Slim و SFS_Code.

سيمبيت

بالطبع ، يجب أن أشير إلى منصة المحاكاة الخاصة بي سيمبيت. حسب تجربتي ، فإن SimBit عادة ما يكون أسرع من Nemo. إنها أبطأ من SFS_Code و SLim لعمليات المحاكاة الصغيرة جدًا ولكنها تصبح أسرع بكثير من SFS_Code و SLim عندما تحتاج إلى عمليات محاكاة ذات قدر من التنوع الجيني.

أهم نقطة حول هذه البرامج

يجب عليك مقارنة البرامج على أساس

  • التوفر المؤلف لتقديم المشورة وتقديم ميزات جديدة
    • لن أتحدث عن تجربتي الشخصية هنا باحترام المؤلفين!
  • السرعة / استخدام ذاكرة الوصول العشوائي
    • أعتقد أن SimBit عادة ما يكون أسرع (ويستخدم ذاكرة وصول عشوائي أقل) من Nemo. SFS_code و SLim سريعان جدًا في عمليات المحاكاة ذات التنوع الجيني المنخفض ولكنها بطيئة جدًا في عمليات المحاكاة ذات التنوع الجيني العالي.
  • المرونة
    • Nemo و SLim و SimBit مرنون للغاية (لكنهم يقومون بأشياء مختلفة) لكن SFS_code ليس كذلك حقًا.
  • واجهة المستخدم
    • أجد تقرير خطأ Nemo ضعيفًا جدًا. أنا أحب تقرير خطأ SimBit. واجهة SLim لطيفة جدًا (باستخدام eidos) وهي تأتي أيضًا مع واجهة المستخدم الرسومية (لم أستخدم واجهة المستخدم الرسومية مطلقًا).
  • خالية من الحشرات
    • وجد العديد من الأشخاص أخطاءً مهمة في SFS_code (الاتصال الشخصي والخبرة).

مقارنة أكثر تفصيلاً قليلاً بين Nemo و SLim و SFS_code و SimBit

لقد استخدمت شخصيًا NEMO و SFS_CODE و SLim في الماضي (أستخدم الآن SimBit فقط). لذلك لا يمكنني التحدث إلا عن هذه الأربعة أدناه.

يتم تحديث جميع النماذج الأربعة بشكل جيد وصيانتها بواسطة مؤلفيها وبالطبع يمكن للجميع الوصول إلى الكود المصدري.

SFS_code و SLim سريعان جدًا لعمليات المحاكاة الصغيرة. مسألة SFS_code و SLim هي أن استخدام ذاكرة الوصول العشوائي ووقت التشغيل هما وظيفة أسية للتنوع الجيني. هذا يعني أن بعض عمليات المحاكاة يمكن أن تصبح سريعًا غير قابلة للإدارة تمامًا. لكنها أداة رائعة إذا كنت تتوقع القليل من التنوع الجيني.

عادة ما يكون SimBit أسرع من Nemo ، على الأقل بالنسبة للجينومات الكبيرة. يصبح هذا الاختلاف واضحًا بشكل خاص للجينومات الكبيرة. قد يظن المرء "أوه ، أنا بخير للانتظار بضعة أيام إضافية للحصول على نتائجي" ، لكن الاختلاف في السرعة بين برنامجين يمكن أن يكون أيضًا اختلافًا في ما إذا كان عليك الانتظار لمدة أسبوع أو 20 عامًا للحصول على نتائجك ، لذلك لا تهمل أهمية وقت التشغيل واستخدام ذاكرة الوصول العشوائي دون تقدير احتياجاتك.

Nemo مرن للغاية عندما يتعلق الأمر بترتيب أحداث دورة الحياة (على سبيل المثال الترحيل قبل أو بعد التحديد) ويسمح الإصدار الأحدث بمحاكاة السكان المنظمين حسب العمر. SimBit مرن للغاية وسريع جدًا ويسمح بمحاكاة الأنواع المتعددة وتفاعلاتها البيئية. SFS_code أقل مرونة.


قلقي الوحيد بشأن NEMO هو أن كل فرد يموت بعد التكاثر وأنه لا يمكن أن يكون هناك أكثر من 256 أليلات في نفس الوقت.

يحدد SFS_code عدد الأليلات بـ 4. يحدد Nemo عدد الأليلات إلى 256 (ولكن يمكنك أيضًا استخدام النمط الظاهري ولديك رقم عائم في كل موضع). يستخدم SimBit إما موقع ثنائي الأليلات ، وهو كتلة يتم فيها حساب عدد الطفرات (بحد أقصى: 256 طفرة ؛ وهذا يختلف عن 256 أليلاً لكل قول) أو رقم عائم مستمر في كل موضع للنمط الظاهري. هل حقا تحتاج المزيد من الأليلات؟ لماذا لا يمكنك فقط استخدام عدة مواضع لتمثيل تسلسل بأليلات متعددة؟ يمكن أن تحتوي البيولوجيا الحقيقية على 4 أليلات فقط في أصغر مكان لها! يستخدم SimBit نظام بت لكل بت. إذا كنت بحاجة ، على سبيل المثال ، 50000 أليلات ، فأنت تحتاج فقط إلى طلب تسلسل من 16 بت (2 بايت) ويمكنك الحصول على 2 ^ {16} = 65،536 دولار أليلات.

إذا كنت بحاجة إلى المزيد من الأليلات في كتلة واحدة (وهذا أمر مفاجئ قليلاً بالنسبة لي مسبقًا) ، فيمكنك على الأرجح أن تسأل المؤلف وقد يقبل مساعدتك إذا أقنعته أنه من المهم إضافة هذه الميزة (ربما كن أيضًا أكثر استعدادًا للمساعدة في تبادل التأليف إذا كنت بحاجة إلى مزيد من الدعم).

امل ان يساعد. حظا طيبا وفقك الله!


Messer Lab - SLiM

SLiM هو إطار محاكاة تطوري يجمع بين محرك قوي للمحاكاة الجينية السكانية مع القدرة على نمذجة سيناريوهات تطورية معقدة بشكل تعسفي. يتم تكوين عمليات المحاكاة عبر لغة البرمجة النصية Eidos المدمجة التي تسمح بالتحكم التفاعلي في كل جانب من جوانب السيناريوهات التطورية المحاكاة. تم تحسين محرك المحاكاة الأساسي القائم على الفرد بشكل كبير لتمكين نمذجة الكروموسومات بأكملها في أعداد كبيرة من السكان. نوفر أيضًا واجهة مستخدم رسومية على نظامي macOS و Linux لإعداد المحاكاة السهل والتحكم في وقت التشغيل التفاعلي والتصور الديناميكي لمخرجات المحاكاة.

ورشة عمل SLiM 4-5 أيام متاحة الآن عبر الإنترنت. يتم أيضًا تقديم ورشة عمل SLiM شخصيًا من وقت لآخر ، راجع القسم الفرعي ورش عمل SLiM أدناه للحصول على مزيد من المعلومات.

التنزيلات (الإصدار 3.6)

سيقوم مُثبّت macOS بتثبيت أداة سطر الأوامر النحيفة وبيئة التطوير الرسومية SLiMgui وكلا الدليلين. (إذا كنت تستخدم macOS وترغب في تشغيل تطبيق SLiMguiLegacy القديم المستند إلى Cocoa بدلاً من ذلك ، لسبب ما ، يمكنك تنزيله من http://www.benhaller.com/slim/SLiMguiLegacy.app.zip أو إنشائه في Xcode لم يعد مضمنًا في برنامج التثبيت.) في منصات Un * x الأخرى ، يجب عليك اتباع التعليمات الواردة في دليل SLiM (الفصل 2) قد يكون هناك مُثبِّت لمنصتك ، أو قد تحتاج إلى البناء من المصادر. يمكن أيضًا تشغيل SLiM على Windows ، أسفل WSL ، راجع الدليل للحصول على التفاصيل.

يتضمن دليل SLiM مجموعة من الوصفات للمواقف الشائعة. يمكنك تنزيل أرشيف مضغوط لتلك الوصفات ، إذا كنت ترغب في أن تكون متاحة أيضًا مباشرة من خلال قائمة ملف SLiMgui & # 8217s. يغطي دليل Eidos تفاصيل لغة Eidos ، المستخدمة للتحكم في SLiM عبر البرمجة النصية. تجعل الأوراق المرجعية لكل من SLiM و Eidos من السهل استخدامها مع الحد الأدنى من استخدام الوثائق الكاملة.

لاحظ أن أرشيف كود المصدر المقدم هنا لا يحتوي على رمز محدد لنظام التشغيل MacOS ، ولا يحتوي على مشروع Xcode لـ SLiM ، فهو مخصص لمستخدمي Linux (يُنصح بشدة مستخدمي macOS باستخدام مثبت macOS بدلاً من البناء من المصادر). يمكن العثور على المصادر الكاملة بما في ذلك ملفات macOS على GitHub ، حيث يمكنك الحصول على مصادر لإصدار ذي علامات ، مثل 3.6 ، أو لرئيس التطوير الحالي.

نوفر أيضًا مستودع GitHub يسمى SLiM-Extras مع معلومات مفيدة إضافية لمستخدمي SLiM ، مثل وظائف Eidos المحددة من قبل المستخدم لأداء بعض المهام الشائعة ، ونرحب بالمساهمات في هذا المستودع من الآخرين.

SLiMgui

مع بيئة النمذجة الرسومية SLiMgui (المتوافقة مع macOS و Linux و Windows ضمن WSL) ، يمكنك تصور المحاكاة الخاصة بك أثناء تشغيلها وفحص معلماتها في الوقت الفعلي ، مما يسمح بتطوير المحاكاة بشكل أسهل.

لقطة شاشة لـ SLiMgui تحاكي ديناميكيات السكان لمحرك CRISPR / Cas9 & # 8220gene & # 8221 في نموذج جزيرة مكون من ستة مجموعات سكانية مع تباين مكاني في الاختيار على أليل السائق. منطقة البرمجة Eidos على اليسار ، الإخراج على اليمين. يظهر تمثيل مرئي للتركيب السكاني في النافذة الفرعية ، ويمكن رؤية جميع الأفراد في المجموعات السكانية الفرعية الستة في الأعلى (ملونًا وفقًا للياقة البدنية النسبية لهم). يُظهر الشريط الأسود المركزي ملخصًا للاختلاف الجيني الموجود في المجموعة ، تظهر الطفرات المحايدة النادرة كأشرطة صفراء قصيرة ، ويمثل الشريط الأحمر الطويل أليل المحرك الذي يقترب من التثبيت.

القوائم البريدية

هناك نوعان من القوائم البريدية. يرجى الاشتراك في أحدهما أو كليهما باستخدام الروابط أدناه:

    : قائمة بريدية صغيرة الحجم للإعلانات فقط. لا يجوز للمستخدمين النشر في هذه القائمة. : قائمة بريدية كبيرة الحجم للأسئلة والتعليقات وتقارير الأخطاء والمناقشة بين مستخدمي SLiM.

ورش عمل SLiM

نحن ندير ورش عمل SLiM لمدة 5 أيام مجانية ومفتوحة للجمهور (مع التسجيل). ومع ذلك ، فإن ورش العمل هذه معلقة في الوقت الحالي بسبب وباء فيروس كورونا.

مواد ورشة العمل متاحة الآن على الإنترنت ، للأشخاص الذين يرغبون في القيام بذلك بأنفسهم ، قم بزيارة صفحة تنزيل ورشة العمل عبر الإنترنت لمزيد من المعلومات.


ورشة العمل الأولى لـ SLiM: أوميو ، السويد ، أغسطس 2019.

أخبار

2021 3 مارس: تم إصدار SLiM 3.6! هذا إصدار رئيسي به العديد من الميزات الجديدة والعديد من إصلاحات الأخطاء المهمة. هذه الترقية بقوة موصى به لجميع المستخدمين الإصدار 3.5 لا ينبغي استخدامه بسبب خطأين قد يتسببان في نتائج نموذج غير صحيحة. لمزيد من المعلومات ، راجع إعلان ضئيل للإعلان وملاحظات الإصدار.

2020 8 ديسمبر: تم إصدار SLiM 3.5! هذا إصدار رئيسي به العديد من الميزات الجديدة والعديد من إصلاحات الأخطاء المهمة. يوصى بهذه الترقية لجميع المستخدمين ، لكنها تقطع التوافق مع الإصدارات السابقة / إمكانية التكرار بعدة طرق ، اقرأ ملاحظات الإصدار بعناية. لمزيد من المعلومات ، راجع إعلان ضئيل للإعلان وملاحظات الإصدار.

2020 12 مايو: تم إصدار SLiM 3.4! يعد هذا إصدارًا رئيسيًا ، بما في ذلك الإصدار الأول من QtSLiM ، بالإضافة إلى بعض الميزات والإصلاحات الجديدة الأخرى لبعض الأخطاء. يوصى بهذه الترقية لجميع المستخدمين. لمزيد من المعلومات ، راجع إعلان ضئيل كالمعتاد.

2020 30 يناير: تم تحرير SLiM 3.3.2! هذا إصدار ثانوي ، مع العديد من التحسينات والإصلاحات الصغيرة لبضع أخطاء (واحدة مهمة). يوصى بهذه الترقية لجميع المستخدمين. لمزيد من المعلومات ، راجع إعلان ضئيل كالمعتاد.

2020 من 13 إلى 17 يناير: كان لدينا ورشة عمل SLiM على أرضنا ، في كورنيل! لقد أجرينا & # 8217 زوجين حتى الآن (السويد والمملكة المتحدة ومدينة نيويورك) ولكن هذا كان الأول لنا في كورنيل. كان لدينا 28 مشاركًا ، وسار الأمر بشكل جيد للغاية ، بما في ذلك غداء تم تقديمه برعاية 3CPG. لقد تم التخطيط لمزيد من ورش العمل (انظر القسم الفرعي السابق) ، يرجى الاتصال بنا إذا كنت & # 8217d ترغب في استضافة ورشة عمل في مؤسستك!

2019 سبتمبر 28: تم تحرير SLiM 3.3.1! هذا الإصدار هو إصدار ثانوي ، معظمه إصلاحات للأخطاء (بما في ذلك بعض الأخطاء النادرة ولكنها سيئة!). يوصى بهذه الترقية لجميع المستخدمين. لمزيد من المعلومات ، راجع الكتيبات الجديدة ، وملاحظات الإصدار في الإعلان على ضئيلة.

2019 15 مايو: تم تحرير SLiM 3.3! هذا الإصدار هو إصدار رئيسي ، مع ميزات جديدة كبيرة (النماذج القائمة على النيوكليوتيدات ، واسترجاع الطفرات () ، وما إلى ذلك) وبعض إصلاحات الأخطاء الكبيرة والمهمة. هذه الترقية موصى بها بشدة لجميع المستخدمين. لمزيد من المعلومات ، راجع الكتيبات الجديدة ، وملاحظات الإصدار في الإعلان على ضئيلة.

2019 يناير 29: تم إصدار SLiM 3.2.1! هذا الإصدار هو إصدار ثانوي ، يوفر بعض الإضافات الصغيرة للميزات وبعض الوصفات الجديدة ، بالإضافة إلى إصلاحات الأخطاء. لمزيد من المعلومات ، راجع الكتيبات الجديدة ، وملاحظات الإصدار في الإعلان على ضئيلة.

2019 18 يناير: في الأيام الأخيرة لدينا ثلاث (!) أوراق جديدة منشورة تتعلق بـ SLiM. (1) & # 8220SLiM 3: المحاكاة الجينية الأمامية التي تتجاوز نموذج Wright – Fisher & # 8221 تصف دعم النماذج التي لا تتبع Wright – Fisher والمساحة المستمرة في SLiM 3 (DOI). (2) & # 8220 النمذجة التطورية في SLiM 3 للمبتدئين & # 8221 يمشي المستخدمين الجدد من خلال إنشاء نموذج بسيط في SLiM 3 ، مع الكثير من تفسيرات المفاهيم الأساسية (DOI). (3) & # 8220 تسجيل تسلسل الشجرة في SLiM يفتح آفاقًا جديدة لمحاكاة الوقت الأمامي للجينومات الكاملة & # 8221 يناقش ميزة تسجيل تسلسل الشجرة الجديدة في SLiM 3 بالتفصيل ، مع العديد من الأمثلة لتطبيقها العملي لتسريع تنفيذ النموذج ، حرق- في المحاكاة وتحليل البيانات (DOI). نأمل أن تكون هذه الأوراق مفيدة في التعرف على جميع الأشياء الجديدة التي كنا نعمل عليها & # 8217ve!

2018 6 نوفمبر: تم إصدار SLiM 3.2! يعمل هذا الإصدار على تحسين أداء النماذج الكبيرة بخلاف WF بشكل كبير ، كما يوفر العديد من التحسينات وإصلاحات الأخطاء. لمزيد من المعلومات ، راجع الكتيبات الجديدة ، وملاحظات الإصدار في الإعلان على ضئيلة.

2018 3 سبتمبر: تم تحرير SLiM 3.1! يعمل هذا الإصدار على تحسين أداء التفاعلات المكانية بشكل كبير ، ويوفر تحسينات لتسجيل تسلسل الشجرة ، من بين التحسينات الأخرى وإصلاحات الأخطاء. لمزيد من المعلومات ، راجع الكتيبات الجديدة ، وملاحظات الإصدار في الإعلان على ضئيلة.

2018 يوليو 1: تم تحرير SLiM 3.0! هذه هي أول ترقية للنسخة الكاملة منذ إطلاق SLiM 2.0 في أوائل عام 2016. فهي تضيف دعمًا للنماذج غير Wright-Fisher (nonWF) وتسجيل تسلسل الشجرة ، وهما ميزتان تزيدان بشكل كبير من قوة ومرونة SLiM & # 8217s. تم إجراء العديد من التحسينات الأصغر أيضًا. لمزيد من المعلومات ، راجع الكتيبات الجديدة ، وملاحظات الإصدار في الإعلان على ضئيلة.

2017 16 ديسمبر: تم تحرير SLiM 2.6! هذا إصدار رئيسي ، مع الكثير من الأشياء الجديدة انظر الكتيبات الجديدة ، وملاحظات الإصدار في الإعلان في إعلان ضئيل.

2017 أكتوبر 27: تم إطلاق SLiM 2.5! هذا إصدار رئيسي ، مع الكثير من الأشياء الجديدة وبعض إصلاحات الأخطاء المهمة ، انظر الكتيبات الجديدة ، وملاحظات الإصدار في الإعلان عن الإعلان النحيف.

2017 12 سبتمبر: تم إصدار SLiM 2.4.2 (إصلاح الخلل الذي قد يتسبب في إخراج غير صحيح من العديد من الطرز / معظمها).

2017 يوليو 26: تم إصدار SLiM 2.4.1 (إصلاح الخلل الذي قد يتسبب في حدوث أعطال أو نتائج غير صحيحة في محاكاة مجموعات سكانية فرعية متعددة).

2017 يوليو 14: تم إصدار SLiM 2.4! يعد هذا إصدارًا رئيسيًا ، مع تحسينات في السرعة لأنواع عديدة من الطرز ، ودعم جديد لتوصيف وقت التشغيل في SLiMgui ، والعديد من الميزات الأخرى. راجع كتيبات SLiM و Eidos الجديدة للحصول على التوثيق الحالي. هناك أيضا ملاحظات الإصدار في الإعلان عن إعلان ضئيل.

2017 18 أبريل: تم تحرير SLiM 2.3! يعد هذا إصدارًا رئيسيًا ، ولا سيما إضافة دعم للتفاعلات المكانية والمكانية المستمرة. راجع كتيبات SLiM و Eidos الجديدة للحصول على التوثيق الحالي. هناك أيضا ملاحظات الإصدار في الإعلان عن إعلان ضئيل.

2017 فبراير 22: تم إصدار SLiM 2.2.1 (وصفات جديدة وميزات ثانوية وإصلاحات).

2016 ديسمبر 8: تم تحرير SLiM 2.2! هذا إصدار رئيسي مع تحسينات كبيرة في الأداء والعديد من الميزات الجديدة. راجع كتيبات SLiM و Eidos الجديدة للحصول على التوثيق الحالي. هناك أيضا ملاحظات الإصدار في الإعلان عن إعلان ضئيل.

2016 نوفمبر 8: تم إصدار SLiM 2.1.1 (معظمها إصلاحات للأخطاء ، بعضها خطير).

2016 أكتوبر 4: منشورنا على SLiM 2 خارج في علم الأحياء الجزيئي والتطور: DOI.

2016 سبتمبر 19: تم تحرير SLiM 2.1! هذا إصدار رئيسي مع الكثير من الميزات المضافة. راجع كتيبات SLiM و Eidos الجديدة للحصول على التوثيق الحالي. هناك أيضا ملاحظات الإصدار في الإعلان عن إعلان ضئيل.

2016 26 مايو: تم إصدار SLiM 2.0.4 (إصلاحات بسيطة للأخطاء).

2016 12 مايو: تم إصدار SLiM 2.0.3 (تحسينات لإكمال الكود).

2016 6 مايو: تم إصدار SLiM 2.0.2 (إضافات ميزات ثانوية).

2016 27 أبريل: تم إصدار SLiM 2.0.1 (إصلاح أخطاء طفيفة وإضافة ميزة ثانوية).

2016 أبريل 1: تم تحرير SLiM 2.0! يسعدنا الإعلان عن SLiM 2.0 ، وهو إصدار رئيسي جديد لحزمة SLiM. يضيف SLiM 2.0 إمكانية البرمجة باستخدام Eidos ، وتطوير محاكاة تفاعلية باستخدام تطبيق SLiMgui. لقد وضعنا منشور مدونة يحتوي على مزيد من التفاصيل حول إصدار SLiM 2.0.

الترخيص والاستشهاد

SLiM هو برنامج مجاني مفتوح المصدر ، مرخص بموجب GNU General Public License الإصدار 3. إذا كنت تستخدم SLiM في بحثك ، يرجى ذكرنا.

ل SLiM 3، استشهد:

Haller، BC، & amp Messer، P.W. (2019). SLiM 3: عمليات محاكاة جينية متقدمة تتجاوز نموذج رايت فيشر. البيولوجيا الجزيئية والتطور 36(3) ، 632-637. DOI

للنماذج التي تستخدم تسجيل تسلسل الشجرة، استشهد:

Haller، BC، Galloway، J.، Kelleher، J.، Messer، P.W.، & amp Ralph، P.L. (2019). يفتح تسجيل تسلسل الشجرة في SLiM آفاقًا جديدة لمحاكاة الوقت المتقدم للجينومات بأكملها. موارد البيئة الجزيئية 19(2) ، 552-566. DOI

إذا كان ذلك مناسبًا ، فاستشهد بورقة & # 8220protocol & # 8221 الخاصة بـ بداية مستخدمي SLiM:

Haller، BC، & amp Messer، P.W. (2019). النمذجة التطورية في SLiM 3 للمبتدئين. البيولوجيا الجزيئية والتطور 36(5) ، 1101-1109. DOI

للنماذج القديمة التي تستخدم SLiM 2، استشهد:

Haller، BC، & amp Messer، P.W. (2017). SLiM 2: عمليات محاكاة جينية أمامية مرنة وتفاعلية. البيولوجيا الجزيئية والتطور 34(1) ، 230-240. DOI

ولل SLiM 1، استشهد:

ميسر ، P.W. (2013). SLiM: محاكاة التطور بالاختيار والربط. علم الوراثة 194(4) ، 1037-1039. DOI

رمز SLiM

يمكن تنزيل ملفات الرسومات الخاصة برمز SLiM هنا. هذه الصور هي: حقوق الطبع والنشر (c) 2016-2019 لـ Philipp Messer ، جميع الحقوق محفوظة. يُمنح الإذن بموجب هذا لإعادة الاستخدام على وجه التحديد للأغراض المتعلقة بـ SLiM والتي تحترم وتدعم مجتمع SLiM. إذا كان لديك أي شك في هذا ، يرجى الاتصال بنا للحصول على إذن. يتم توفير أحجام وأشكال مختلفة.

طريقة قديمة

بالنسبة للمشاريع الجديدة ، يوصى بشدة باستخدام الإصدار الحالي. يمكن العثور على الإصدارات القديمة من SLiM 2.0 وما بعده على GitHub باستخدام علامات الإصدار. هذه الإصدارات القديمة لم تعد مدعومة.

المنشورات

قد يكون من المفيد أن ترى كيف يستخدم الآخرون SLiM في بعض الأحيان ، يمكنك حتى تنزيل نموذج SLiM الفعلي المستخدم في الورقة. ومع ذلك ، فإن تحديث قائمة بجميع المنشورات التي تستشهد بـ SLiM أصبح مستهلكًا للوقت ، لذلك نقدم الآن روابط لبحوث الباحث العلمي من Google ، للأوراق التي تستشهد بأوراق SLiM الخاصة بنا.


تثبيت PopG

فيما يلي إرشادات حول حفظ PopG وتفريغ محتوياته وتثبيته من متصفحات مختلفة وأنظمة تشغيل.نحن نغطي متصفحات Chrome و Firefox و Safari و Internet Explorer على أنظمة تشغيل Windows و Mac OS X و Linux.

  1. اضغط على الرابط.
  2. يتحرك سهم متحرك يشير لأسفل في الجزء الأيسر السفلي من نافذة المتصفح ، مشيرًا إلى علامة تبويب هناك تسمى PopG.zip.
  3. سيتم الآن العثور على PopG.zip في مجلد التنزيلات.
  4. انقر (أو إذا لم ينجح ذلك ، انقر نقرًا مزدوجًا) على ملف PopG.zip. سيتم استخراج أرشيف Zip في مجلد التنزيلات. مجلد بوبجي سيتم إنشاؤه في مجلد التنزيلات.
  5. انقل هذا المجلد إلى المكان الذي تريده.
  1. اضغط على الرابط.
  2. يفتح مربع حوار ويعرض للسماح لك احفظ الملف. اختر ذلك.
  3. أرشيف مضغوط PopG.zip سيكون في مجلد التنزيلات الخاص بك.
  4. انقر نقرًا مزدوجًا فوقه. سيتم استخراج الأرشيف ومجلد بوبجي تم إنشاؤه في مجلد التنزيلات.
  5. انقل هذا المجلد إلى المكان الذي تريده.
  1. اضغط على الرابط.
  2. يفتح مربع حوار ويعرض للسماح لك احفظ الملف. اختر ذلك.
  3. ملف مضغوط PopG.zip سيتم تنزيله في مجلد التنزيلات وسيتم استخراجه تلقائيًا. مجلد بوبجي سيتم إنشاؤه في مجلد التنزيلات.
  4. انقلها حيث تريدها أن تكون.
  1. اضغط على الرابط.
  2. سيتم تنزيل ملف Zip في مجلد التنزيلات وسيتم استخراجه تلقائيًا. مجلد بوبجي سيتم إنشاؤه في مجلد التنزيلات.
  3. انقلها حيث تريدها أن تكون.

مشكلة MAC: في أنظمة Mac OS X ، عندما تحاول استخراج أرشيف Zip ، أو عندما تحاول تشغيل Java القابل للتنفيذ ، قد يشكو النظام من أن هذا من مطور غير معروف. هذا ببساطة لأنني لم أوقع الملف بمعرف Apple Developer الخاص بي. يجب أن تكون قادرًا على جعل العملية تعمل عن طريق النقر بالضغط على مفتاح التحكم على الرمز وتحديد خيار فتح الملف ، باستخدام الإعدادات الافتراضية المقترحة. بمجرد تجاوز هذا بنجاح ، لن يزعجك بذلك مرة أخرى.

أرشيف جافا

ملف أرشيف جافا PopG.jar سيكون موجودًا في المجلد بوبجي بمجرد تنزيل PopG وتثبيته. إذا كان لديك Java مثبتًا على نظامك ، فيجب أن تكون قادرًا على تشغيل برنامج Java من خلال العثور على المجلد بوبجي والنقر أو النقر المزدوج على أيقونة الملف PopG.jar

صفحة التوثيق

يتضمن مجلد PopG أيضًا صفحة الويب الخاصة بالوثائق الحالية التي تقرأها الآن. يمكن قراءة هذا هنا أو يمكنك استخدام عنصر القائمة "حفظ باسم" في قائمة "ملف" في متصفحك لحفظ نسخة منه على جهازك. يمكن قراءة أحدث نسخة من هذه الصفحة على الويب باستخدام هذا الارتباط.

الإصدارات الأقدم من PopG

هناك أيضًا إصدارات أقدم قابلة للتنفيذ تم تجميعها لأنظمة Windows و Mac OS X و Linux ، بالإضافة إلى بعض أنظمة التشغيل الأقدم. يمكن جلبها من مجلد قديم في موقع PopG الخاص بنا. يجب على معظم المستخدمين عدم استخدام هذه الملفات القابلة للتنفيذ القديمة ، ولكن إذا قمت بذلك ، يجب أن تبدأ بقراءة ملف اقرأني ملف في هذا المجلد. أحد الإصدارات هناك هو الإصدار 3.4 ، والذي قام بتجميع الملفات التنفيذية لأنظمة التشغيل الرئيسية الثلاثة المتاحة بالإضافة إلى الكود المصدري للغة C. قد تكون هذه مفيدة إذا لم يكن لديك Java ولا يمكنك تثبيتها على نظامك.

أين إصدارات Android و iOS؟ ''

نود أن نجعل الإصدارات متاحة للأجهزة اللوحية وحتى للهواتف. لسوء الحظ ، يبدو أن إصدار Java الذي يمكنه استخدام وظائف الرسومات غير موجود على نظام التشغيل Android ونظام التشغيل iOS. سيتعين علينا إعادة كتابة البرنامج بشكل منفصل لكل منها. إذا كنت تعرف طريقة لتشغيل ملفات Java التنفيذية الخاصة بنا على أي من أنظمة التشغيل هذه ، وتشغيلها ، فالرجاء إخبارنا كيف فعلت ذلك.

تأكد من أن لديك Java على جهاز الكمبيوتر الخاص بك

إذا كان لديك Java مثبتًا ، فيمكنك تشغيل برنامج PopG. بشكل عام ، سيتم تثبيت Java بالفعل على أنظمة Mac OS X وأنظمة Linux. إذا لم تكن متأكدًا مما إذا كان لديك Java مثبتًا ، فيمكنك الكتابة جافا الإصدار في نافذة الأوامر ، وإذا كانت Java موجودة ، فسوف تخبرك ما هو الإصدار. إذا استعدت سطرًا فارغًا ، فأنت بحاجة إما إلى تنزيل Java أو إلحاقه بمسار البحث الخاص بك. في أنظمة Windows وأنظمة Mac OS X أو Linux التي لا تحتوي على Java ، يمكنك تثبيت إصدار حديث من Java بدون تكلفة باستخدام هذا الارتباط: java.com. عادةً ما تحتوي أنظمة Linux و Mac OS X الحديثة على إصدار حديث كافٍ من Java مثبت بالفعل. قد لا تحتوي أنظمة Mac OS X 10.4 (Leopard) والإصدارات الأقدم على Java حديثة بما يكفي لتتمكن من تشغيل PopG. لا تأتي أنظمة Windows مثبت عليها Java بالفعل ، ولكن يمكن تثبيتها عليها من موقع الويب أعلاه.

تشغيل البرنامج

لتشغيل برنامج PopG Java ، يجب عليك ببساطة النقر (أو النقر نقرًا مزدوجًا) على أيقونة ملف PopG.jar (يمكنك أيضًا تشغيله من نافذة أوامر بالانتقال إلى المكان PopG.jar يتم تخزينها وكتابتها java -jar PopG.jar). تبدو شاشة البدء كما يلي:

هناك قائمتان ، File and Run ، تتحكمان في PopG. هم في الجزء العلوي الأيسر من نافذة PopG الرئيسية.

قائمة التشغيل

تحتوي القائمة "تشغيل" على خمسة عناصر: متابعة مع / ، متابعة ، تشغيل جديد ، إعادة تشغيل ، وعرض مؤامرة كاملة.

في المرة الأولى التي يتم فيها اختياره ، يبدو كما يلي:

مع كل شيء ما عدا New Run باللون الرمادي. بمجرد الانتهاء من تشغيلك الأول ، ستكون جميع التحديدات نشطة.

تشغيل جديد مبدئيًا يتوفر تشغيل جديد فقط. يعرض مربع الحوار التالي:

يحتوي على جميع المعلمات التي تتحكم في تشغيل PopG. لاحظ أنك لا تدخل عادةً بذرة رقم عشوائي إلا إذا كنت تريد إجراء تشغيلين متطابقين. عند الانتهاء من التحرير ، يمكنك النقر فوق المربع "موافق" لبدء التشغيل. يمكنك أيضًا النقر فوق "إلغاء الأمر" لعدم بدء التشغيل والافتراضيات لإعادة تعيين كافة مربعات إدخال البيانات إلى قيمها الافتراضية. متابعة ث / يستمر هذا الاختيار في التشغيل ، لنفس عدد الأجيال كما تم إدخاله مسبقًا في قائمة تشغيل جديد. متابعة يستمر هذا في الجري ، لكنه يعرض مربع الحوار التالي:

الذي يسمح لك بتغيير عدد الأجيال التي يتم تشغيلها في المتابعة التالية للتشغيل. إعادة التشغيل يؤدي هذا إلى إعادة التشغيل بنفس قيم المعلمات كما في السابق. إذا كنت تريد تغيير بعض قيم المعلمات ، فاستخدم New Run بدلاً من ذلك. عرض مؤامرة كاملة هذا مؤامرات جميع الأجيال على نفس قطعة الأرض. أثناء الجري ، ستظهر المؤامرات عادةً المجموعة الأخيرة من الأجيال فقط. هذا يظهر جميع الأجيال التي تم محاكاتها حتى الآن. يكون هذا مفيدًا بشكل خاص عندما تنتهي من محاكاة وترغب في طباعة نتائج التشغيل بالكامل.

مولد الأرقام العشوائية

يستخدم البرنامج مولد أرقام عشوائيًا يتم التهيئة تلقائيًا من ساعة النظام لديك. وبالتالي يجب أن يمنحك تسلسلًا مختلفًا من الأرقام العشوائية وبالتالي نتيجة مختلفة في كل مرة تقوم فيها بتشغيل البرنامج. في القائمة للتشغيل الجديد ، يوجد إعداد لبداية الرقم العشوائي والذي يتم تعيينه افتراضيًا على (التوليد التلقائي) ، والذي سيتم تهيئته من ساعة النظام. ربما لن يكون لديك أي سبب لتغيير هذا ، إلا إذا كنت تقوم بتصحيح أخطاء PopG وترغب في القيام بنفس التشغيل ، مع نفس النتائج العشوائية ، مرتين. إذا كنت ترغب في القيام بنفس التشغيل مرتين ، فأدخل قيمة بدلاً من سلسلة (Autogenerate) وسيستخدم PopG ذلك لتهيئة منشئ الأرقام العشوائية. بافتراض أنك لم تقم بتعديل ملف كاسبوبج روتينًا داخل كود Java ، في كل مرة تبدأ فيها بهذا الرقم العشوائي ، ستحصل على نفس النتائج تمامًا.

قائمة ملف

هذا يحتوي على أربعة عناصر القائمة. هم حفظ ، طباعة ، حول وإنهاء.

عند عرضه لأول مرة ، يبدو كما يلي:

مع حفظ وطباعة باللون الرمادي. بمجرد الانتهاء من تشغيلك الأول ، سيكونون نشطين.

حفظ يؤدي هذا إلى فتح مربع حوار حفظ ملف قياسي ويسمح لك بحفظ الرسم البياني كملف JPG أو PNG. الاسم الافتراضي هو PopG بالامتداد المناسب ليتوافق مع تنسيق الملف. طباعة يؤدي هذا إلى فتح مربع حوار طباعة قياسي ويسمح لك بتحديد طابعة وطباعة الرسم البياني. حول يعرض إشعار حقوق النشر الخاص بالبرنامج. Quit هذا أمر لا يحتاج إلى شرح: إنهاء البرنامج.

تجميعها بنفسك

لن يحتاج معظم الأشخاص إلى تجميع البرنامج بأنفسهم حيث يجب تشغيل حزمة Java Jar المتوفرة على معظم إصدارات Java. لذلك ربما يجب عليك تخطي هذا القسم. ولكن إذا كنت ترغب في تعديل وظائف PopG أو إذا كان لديك بيئة Java غير عادية لن تقوم بتشغيل ملف Jar المرفق ، فستحتاج إلى مترجم Java. نكرر: إذا كنت تحتاج فقط إلى تشغيل البرنامج ، فيجب عليك تشغيل ملف Jar الذي يأتي في التوزيع الخاص بنا. لا تحتاج إلى تجميع أي شيء (على الرغم من أنك قد تحتاج إلى تثبيت Java).

إذا كنت بحاجة إلى تجميع البرنامج ، فستجد ملف src الدليل في المجلد الذي تم تنزيله وفك ضغطه بوبجي التي حصلت عليها من موقعنا. قم باستيراد الملف PopGUserInterface.java من عند src في محرر Java المفضل لديك (استخدمنا ملفات كسوف). يمكنك إما تنفيذه مباشرة من هناك أو تصدير Java Jar من المحرر وتنفيذها. PopGUserInterface.java لا يشير إلى أي مكتبات خارجية ، فكل ما يحتاج إليه موجود في JavaSE-1.6 مكتبة النظام. إذا كنت تقوم بتعديل برنامجنا ، فبمجرد الانتهاء من ذلك ، لن تواجه أي مشاكل في إنشاء Java Jar ،

إذا كنت لا تستطيع أن تفعل ، أخبرنا ، لأن ذلك سيكون خطأ.

محاكاة مع PopG

يحاكي هذا البرنامج تطور مجموعات التزاوج العشوائي مع أليلين ، واللياقة التعسفية للأنماط الجينية الثلاثة ، ومعدل الطفرات التعسفية ، ومعدل الهجرة التعسفي بين المجموعات المكررة ، وحجم السكان المحدود.

تحاكي البرامج مجموعات سكانية متطورة في نفس الوقت مع تحديد حجم السكان ، وملاءمة الأنماط الجينية الثلاثة ، ومعدلات الطفرات في كلا الاتجاهين (من أ إلى أ ومن أ إلى أ) ، والتردد الجيني الأولي. يطلبون أيضًا معدل الهجرة بين جميع السكان ، مما يجعل ترددات الجينات الخاصة بهم أكثر تشابهًا مع بعضها البعض. ستحتاج في كثير من الأحيان (ولكن ليس دائمًا!) إلى ضبط معدل الترحيل هذا على صفر. في معظم النواحي البرنامج لا يحتاج إلى شرح.

في البداية هناك عشرة من السكان. يمكنك تعيين عدد السكان الذين يتطورون في وقت واحد على أي عدد من 0 إلى 1000. يمكن أن يكون حجم السكان لكل مجموعة أي عدد من 1 إلى 10000. لاحظ أن عددًا أكبر من السكان ، وعددًا أكبر من الأجيال يتم تشغيله ، وعدد أكبر من السكان يمكن أن يؤدي إلى مسافات أطول.

عندما تقوم بتحديد قائمة تؤدي إلى تشغيل البرنامج ، سيتم رسم رسم بياني للترددات الجينية للأليل A في كل مجموعة في النافذة. هذا هو الشكل الذي يبدو عليه الرسم البياني عند تشغيلنا بتردد جيني أولي يبلغ 0.2 وتعيين لياقة AA و Aa و aa على 1.08 و 1.04 و 1 ، مع جميع المعلمات الأخرى في قيمها الافتراضية. (لاحظ أنه إذا جربت هذا التشغيل ، فستكون هناك أرقام عشوائية مختلفة ، لذا ستكون نتيجتك مختلفة قليلاً).

لاحظ أنه يمكن تغيير حجم النافذة ، ويجب أن يتكيف الرسم البياني مع هذا. يوجد أيضًا منحنى أزرق يوضح ترددات الجينات في مجموعة لا نهائية من السكان (مجتمع بدون انحراف جيني). إذا تم ضبط عدد السكان الذي يتم محاكاته على صفر ، فإن هذا المنحنى هو كل ما ستراه. يمكن طباعة الرسم البياني باستخدام خيار "طباعة" من قائمة "ملف" ، أو حفظه في ملف بوستسكريبت باستخدام خيار "حفظ" في تلك القائمة.

لاحظ أنه بمجرد وصول مخطط منحنيات تردد الجينات إلى الجانب الأيمن من الرسم البياني ، يقوم البرنامج بطباعة عدد السكان الذي تم إصلاحه للأليل A (انتهى بتردد 1.0) والرقم الذي فقد هذا الأليل .

اقتراحات

  • جرب الحالات التي لا تحتوي على طفرة ولا هجرة وجميع الملاءمة 1.0 حتى لا يكون هناك اختيار. هل يحدث الانجراف الجيني في مجموعة يبلغ حجمها 1000 نسمة تقريبًا نفس التغييرات في 1000 جيل مثل الانجراف الجيني في مجموعة من الحجم 100 في 100 جيل؟ من خلال تشغيل عدد كبير من المجموعات ، هل يمكنك التحقق مما إذا كان احتمال إصلاح الأليل عن طريق الانجراف الجيني يساوي تواتره الأولي في المجموعات السكانية؟
  • جرب حالة بدون طفرة أو هجرة ، مع تفضيل الانتقاء الطبيعي للأليل A (مع ملاءمة النمط الجيني AA لأعلى مستوى وملاءمة النمط الجيني aa أدنى). ابدأ بتردد صغير من A. هل هو ثابت دائما؟ إذا بدأ المرء بنسخة واحدة من الأليل ، فكيف يقارن احتمال أن يكون A ثابتًا مع معامل الاختيار الذي يفضله في الزيجوت المتغاير (الكسر الذي بواسطته أأ أعلى مقارنة بملاءمة النمط الجيني aa)؟ هل احتمال التثبيت هذا أكبر من الذي ستحصل عليه بنفس التردد الأولي ولكن بدون تحديد؟
  • جرب الهيمنة المفرطة (أأ التي تتمتع بأعلى لياقة). هل يتقارب تردد الجينات نحو التوازن؟ لماذا يختلف عن تردد التوازن هذا؟ ما حجم معاملات الانتقاء التي يجب أن تجعل تردد الجين يبتعد عن التثبيت أو الفقد لفترات طويلة من الوقت؟
  • جرب تمارين البطن الأقل لياقة (أأ الأقل لياقة). هل هناك تواتر جيني ابتدائي سينتج عنه توجه بعض المجموعات السكانية إلى التثبيت ، والبعض الآخر يتجه نحو الضياع؟ إذا أضفت قدرًا صغيرًا من الترحيل ، فماذا سيحدث على المدى الطويل؟ ماذا سيحدث إذا أضفت بدلاً من ذلك كمية صغيرة من الطفرة في كلا الاتجاهين؟
  • مع الهجرة ولكن بدون اختيار أو طفرة ، ما مقدار الهجرة اللازمة لجعل منحنيات تردد الجينات متشابهة تمامًا مع بعضها البعض؟ ما هو المقدار المطلوب لجعلهم جميعًا ينتهي بهم الأمر عند نفس التردد الجيني على المدى الطويل؟ كيف يتأثر معدل الهجرة هذا بحجم السكان؟
  • مع طفرة ولكن بدون هجرة أو انتقاء ، ما مقدار الطفرة اللازمة لجعل ترددات الجينات تتقارب مع تردد جينات التوازن الطفري؟ كيف ترتبط هذه القيمة بحجم السكان؟
  • إذا تم اختيار الأليل ضده ، فهل يمكنك إعداد معدلات طفرة تحافظ عليه عند التردد المنخفض في المجتمع؟

الاعتمادات

الإصدار 4.0 من PopG ، أول إصدار جافا ، كتبه بن زوادزكي. استفادت برامجه الفعالة للغاية من التوجيه والمشورة من معالج Java في مختبرنا ، Jim McGill.

تمت كتابة النسخة الأصلية من PopG في السبعينيات في FORTRAN بواسطة Joe Felsenstein. تمت كتابة النسخة التفاعلية بعد ذلك بلغة C مع الكثير من الأعمال من قبل هيساشي هورينو ، وشون لامونت ، وبيل ألفورد ، ومارك ويلز ، ومايك بالتشوسكي ، ودوغ بوكستون ، وإليزابيث ووكوب ، وبن زوادزكي ، وجيم ماكجيل. كتب هيساشي وشون إصدار C ، ورسومات الشاشة لجهاز كمبيوتر IBM الشخصي والجزء الأول من نظام طباعة بوستسكريبت. قام بيل بتحسين وتوسيع طباعة بوستسكريبت ورسومات X windows. قام Mark Wells بعمل إصدار Macintosh الأصلي. قام Mike Palczewski بتحسين واجهة المستخدم الرسومية لـ Windows و Macintosh و X Windows بشكل كبير ، وقام Doug Buxton بتعديل البرنامج إلى الإصدار 3.0 وأعد الملفات التنفيذية لأنظمة تشغيل مختلفة. قامت Elizabeth Walkup بتحسين تفاعل X windows وأعدت الإصدار 3.3. تم إجراء تغييرات صغيرة على الوثائق بعد الإصدار 4.0 بواسطتي.


BEAST: التحليل التطوري البايزي عن طريق أخذ عينات من الأشجار

خلفية: يعد التحليل التطوري لتباين التسلسل الجزيئي مشروعًا إحصائيًا. ينعكس هذا في زيادة استخدام النماذج الاحتمالية للاستدلال النشئي ، ومحاذاة التسلسل المتعدد ، وعلم الوراثة السكانية الجزيئي. نقدم هنا BEAST: هندسة برمجية سريعة ومرنة لتحليل بايزي للتسلسلات الجزيئية المرتبطة بشجرة تطورية. يتم توفير عدد كبير من النماذج العشوائية الشائعة لتطور التسلسل ويتم تنفيذ النماذج المستندة إلى الأشجار المناسبة لكل من بيانات التسلسل داخل الأنواع وفيما بينها.

نتائج: يتكون BEAST الإصدار 1.4.6 من 81000 سطر من كود مصدر Java و 779 فئة و 81 حزمة. يوفر نماذج لتطور تسلسل الحمض النووي والبروتين ، والتحليل المترابط حدودي للغاية ، وعلم الوراثة على مدار الساعة المريح ، وبيانات التسلسل غير المعاصر ، والمحاذاة الإحصائية ومجموعة واسعة من الخيارات للتوزيعات السابقة. شفرة مصدر BEAST موجهة للكائنات ، معيارية في التصميم ومتاحة مجانًا على http://beast-mcmc.googlecode.com/ بموجب ترخيص GNU LGPL.

استنتاج: BEAST عبارة عن حزمة تحليل تطوري قوية ومرنة لتغير التسلسل الجزيئي. كما يوفر موردًا لمزيد من تطوير النماذج الجديدة والأساليب الإحصائية للتحليل التطوري.


نتائج ومناقشة

الاختبار 1: عمليات الإدراج وحدها أو الحذف وحدها

كان اختبارنا الأول هو تشغيل محاكاة الإدراج فقط والحذف فقط. تم إصلاح أطوال Indel مع 1 ، 2 ، 4 ، و 8 بقايا أو قواعد. قمنا بقياس أداء كل طريقة من خلال 1) طول المحاذاة المتعددة الحقيقية للإدخالات ، حيث يكون عدد المواقع المدرجة مساويًا لطول المحاذاة ناقص 1000 ، و 2) عدد الأحرف المتبقية في تسلسل الإخراج لعمليات الحذف.

يوضح الشكل 5 والشكل التكميلي S3 ، المواد التكميلية عبر الإنترنت ، نتائج الاختبار. كان لعدد العقد الداخلية في شجرة الدليل تأثير سلبي على أداء SIMPROT و iSGv1.0 و ROSE و MySSP (فقط في حالة الإدخالات). كأثر جانبي للنمذجة المستمرة لل indels ، المبالغة في تقدير عمليات الحذف (الشكل 5أ و ب ) والتقليل من الإدخالات (الشكل 5ج و د ) بوضوح مع عدد أقل من العقد الداخلية. تحسب هذه الطرق العدد المتوقع لأحداث indel دون ضبط طول التسلسل عند حدوث حدث. لا تظهر DAWG و iSGv2.0 و EvolveAGene3 أي تأثيرات أو تأثيرات طفيفة جدًا في أرقام indel. بالنسبة إلى DAWG و iSGv2.0 ، هذا بسبب ضبط أطوال التسلسل ديناميكيًا على طول الفرع. من المحتمل أن تكون النتائج غير المتأثرة بواسطة EvolveAGene3 ناتجة عن حقيقة أن هذه الطريقة تعامل أطوال الفروع على أنها عدد اختبارات حدث الطفرة التي تحدث على طول الفرع. لغرضنا ، قمنا بتعيين طول الفرع على 8000 اختبار حدث طفرة (تسلسل 1000 حرف مع كل موقع يخضع لثمانية بدائل). يحظر EvolveAGene3 أيضًا عمليات الإدراج والحذف المتداخلة ، مما يقلل بشكل فعال معدلات الحذف مع عمليات الحذف الأكبر. يمكن رؤية هذا التأثير في الشكل التكميلي S3 (I) ، المواد التكميلية عبر الإنترنت ، حيث يتم ترك الأحرف & # x0201cmore & # x0201d بعد عمليات المحاكاة بأحجام حذف أكبر. بسبب احتمالات الإدراج والحذف الثابتة المحددة في EvolveAGene3 وإزالتنا لقيود الكودون في EvolveAGene3 ، غالبًا ما تكون أطوال المحاذاة أقصر من طرق المحاكاة الأخرى.

مقارنة أداء محاكاة indel (الاختبار 1) بين سبع طرق. من المتوقع أن تنتج عمليات المحاكاة الصحيحة مخططًا ذا خط أفقي. أحجام Indel المستخدمة هي (أ) الحجم -1 عمليات الحذف ، (ب) الحجم - 4 عمليات الحذف ، (ج) حجم 1 ملاحق و (د) حجم 4 ملاحق. ال ذ- تظهر المحاور عدد الأحرف المتبقية في تسلسل الأوراق (أ,ب) وطول المحاذاة الحقيقي (ج, د). تم رسم متوسط ​​القيم التي تم الحصول عليها من 100 محاكاة. يلخص الجدول أدناه الانحرافات المعيارية لكل نقطة بيانات. يوضح الشكل التكميلي S4 ، المادة التكميلية عبر الإنترنت ، جميع نتائج الاختبار بالألوان.

تظهر هذه النتائج أن أداء iSGv2.0 و DAWG كان مناسبًا ، مما أدى إلى نتائج متسقة بغض النظر عن عدد العقد الداخلية. تتصرف EvolveAGene3 أيضًا بشكل مناسب وفقًا لنموذج indel الخاص بها. تتأثر كل من iSGv1.0 و ROSE و SIMPROT و MySSP بعدد العقد الداخلية ، مما ينتج معدلات عالية أو منخفضة بشكل مصطنع للحذف أو الإدراج ، على التوالي.

الاختبار 2: بما في ذلك كل من عمليات الإدراج والحذف مع مختلف صالإضافية و صديل

لمزيد من فحص تأثير نماذج indel ، قمنا بمحاكاة كل من عمليات الإدراج والحذف باستخدام توزيع Zipfian (Chang and Benner 2004) بخمس طرق: DAWG و ROSE و SIMPROT و iSGv1.0 و iSGv2.0. قمنا بمحاكاة ثلاثة سيناريوهات: 1) صالإضافية = 0.01 و صديل = 0.03, 2) صالإضافية = 0.02 و صديل = 0.02 و 3) صالإضافية = 0.03 و صديل = 0.01 ، أين صالإضافية و صديل عدد عمليات الإدراج والحذف لكل استبدال ، على التوالي. لقد اخترنا استخدام توزيع Zipfian لأنه توزيع طول محدد تجريبياً لأحداث الإدراج والحذف. بالنسبة لـ MySSP ، الذي ينفذ توزيع الطول الذي يتم توزيعه بشكل طبيعي بناءً على متوسط ​​الطول indel الذي قدمه المستخدم ، استخدمنا الطول indel المتوقع 2.082 ، والذي يعتمد على توزيع Zipfian مع حجم indel الأقصى 10. تم استبعاد EvolveAGene3 من هذا الاختبار بسبب التغيير صالإضافية و صديل يغير بشكل أساسي طريقة إنشاء indel في EvolveAGene3. في هذا الاختبار ، تمت إضافة عداد حدث يُبلغ عن عدد عمليات الإدراج والحذف التي حدثت أثناء المحاكاة إلى كل طريقة. نظرًا لأننا لم نتمكن من الحصول على الكود المصدري لـ MySSP ، قمنا بحساب عدد الأحداث على النحو التالي: كل فجوة في تسلسل الجذر في المحاذاة المتعددة الحقيقية هي تأثير الإدراج في التسلسلات الفرعية ، وبالمثل ، كل فجوة في تسلسل الطرف هو نتيجة الحذف في تسلسل الأجداد. للحصول على عدد أحداث الإدراج والحذف ، قمنا بتجميع العدد الإجمالي للفجوات في تسلسل الجذر والطرف ، على التوالي ، وقسمنا هذا الرقم على متوسط ​​حجم indel. قمنا بقياس جودة محاكاة indel من خلال مقارنة عدد عمليات الإدراج والحذف التي تم إنشاؤها. حسبنا معامل الاختلاف (& # x003c3 2 /& # x003bc) ، وهو بلا أبعاد ويجعل النتائج من طرق المحاكاة المختلفة قابلة للمقارنة. لو & # x003c3 2 /& # x003bc & # x02248 0 ، فهذا يعني أن طريقة المحاكاة تصرفت بشكل مشابه بين أشجار الدليل (لا يوجد تأثير لعدد مختلف من العقد). وأكبر & # x003c3 2 /& # x003bc يشير إلى أن طريقة المحاكاة أجريت بشكل مختلف بين أشجار الدليل مع عدد مختلف من العقد.

يوضح الشكل 6 والجدول 2 نتائج هذا الاختبار. كما هو متوقع ، يتأثر عدد عمليات الإدراج والحذف التي تم إنشاؤها باحتمالات الإدراج والحذف. بالنسبة لـ iSGv1.0 و ROSE ، متى صالإضافية & # x02260 صديل، يؤثر عدد العقد الداخلية على كل من عدد عمليات الإدراج والحذف. تظهر SIMPROT ، كنتيجة لميزة التصحيح متعدد النتائج ، تأثيرات جذرية مع أرقام العقدة الداخلية أكثر من iSGv1.0 و ROSE عندما يكون معدل الإدراج أكبر من معدل الحذف (صالإضافية = 0.03 و صديل = 0.01). لا تظهر هذه التأثيرات عندما يكون معدل الحذف أكبر (صالإضافية = 0.01 و صديل = 0.03). يُظهر MySSP أعدادًا متزايدة من indels لكل اختبار ، مع حدوث التغيير الأكثر جذرية عندما صالإضافية = 0.03 و صديل = 0.01. يمكن فهم هذا السلوك بشكل أفضل باستخدام نتائج الاختبار 1 ، حيث في حالة الإدخالات ، يزداد طول التسلسل مع إضافة المزيد من العقد الداخلية ، لكن طول التسلسل ثابت للحذف تحت نفس الظروف.

الجدول 2

تأثيرات أرقام العقدة الداخلية مع معدلات الإدراج والحذف المتغيرة بين الطرق أ

& # x003c3 2 /& # x003bc
MySSP سيمبروت دوج iSGv1.0 iSGv2.0 الوردة
الإضافيةديلالإضافيةديلالإضافيةديلالإضافيةديلالإضافيةديلالإضافيةديل
(أ) صالإضافية = 0.01, صديل = 0.030.1450.4330.0030.0120.0150.0040.2160.7260.0210.0020.2260.734
(ب) صالإضافية = 0.02, صديل = 0.020.5070.4170.3800.4350.0140.0020.0040.0010.0220.0070.0030.000
(ج) صالإضافية = 0.03, صديل = 0.014.8711.6752.7360.7570.0060.0030.7340.2950.0050.0310.8160.265

نتائج الاختبار 2 بنسب احتمالية مختلفة لـ indel. لكل طريقة ، يتم عرض العدد الإجمالي للإدخالات (الأشرطة المظلمة) والحذف (الأشرطة الخفيفة) التي تم إنشاؤها لتجارب المحاكاة باستخدام أشجار الدليل بأعداد مختلفة من المقاطع (انظر الشكل 4). لاحظ أنه بالنسبة إلى MySSP ، استخدمنا متوسط ​​القيمة المتوقعة لتوزيع Zipfian للحصول على النتائج. لجميع الطرق ، يتم استخدام متوسط ​​القيم التي تم الحصول عليها من 100 محاكاة.

يلخص الجدول 2 درجة التباين (& # x003c3 2 /& # x003bc) في عدد عمليات الإدراج والحذف بين تجارب الاختبار 2. بالنسبة إلى iSGv1.0 و ROSE ، نلاحظ أن التباين في عدد أحداث الإدراج والحذف يميل بشكل أكبر نحو احتمال الحدث السائد كما هو موضح في الشكل 6 ، بينما يُظهر MySSP تباينًا كبيرًا في جميع الاختبارات ، على الرغم من أنه يكون أكثر وضوحًا عندما معدل الإدراج النسبي مرتفع. يُظهر SIMPROT أيضًا تباينًا عاليًا عندما صالإضافية = 0.03 و صديل = 0.01 أو صالإضافية = صديل، على الرغم من أنه يمكن مقارنته مع iSGv2.0 و DAWG عندما صالإضافية = 0.01 و صديل = 0.03. متي صالإضافية = صديل، يبدو أن نماذج indel لـ iSGv1.0 و ROSE تتأثر قليلاً جدًا بأرقام العقد الداخلية. لاحظ أن متى صالإضافية = صديلتظهر iSGv2.0 و DAWG أكبر قليلاً & # x003c3 2 /& # x003bc قيم من iSGv1.0 و ROSE. هذا نتيجة لعدد أكبر من الخطوات مع أحداث indel وتقييمات طول التسلسل التي تقوم بها هذه الطرق. تزيد المحاكاة كمسيرة عشوائية من التباين في طول التسلسل في كل خطوة. تأخذ DAWG و iSGv2.0 عددًا أكبر من الخطوات (600 و 1،024 ، على التوالي) مقارنةً بثماني خطوات على الأكثر بواسطة جميع المحاكيات الأخرى. لقد أكدنا هذه النتيجة من خلال تغيير عدد الخطوات التي اتخذتها iSGv2 (البيانات غير معروضة).

تطبيق مثال لمحاكاة عائلة البروتين

يوضح الشكل 7 أمثلة على & # x0201ctrue محاذاة & # x0201d الإخراج التي تم الحصول عليها من ROSE و iSGv2.0 (انظر الشكل التكميلي S5 ، المواد التكميلية عبر الإنترنت ، للمخرجات بما في ذلك iSGv1.0). كما هو موضح في الجدول 3 ، احتفظ iSGv2.0 بشكل صحيح بنسبة 80.98٪ من مواضع التسلسل ، في حين أن iSGv1.0 و ROSE ، وكلاهما لا يمكنه الحفاظ على مجموعات من الأحرف ، تم تصميمهما بشكل صحيح فقط بنسبة 61.82٪ و 61.88٪ من المواضع ، على التوالي. من بين الأشكال المختلفة ، حافظ iSGv2.0 تمامًا على جميع مواقع SCR1 (انظر الشكل 7). هذا لأن هذا النموذج كان موجودًا في محاذاة الجذر وتم الحفاظ عليه من بداية المحاكاة على طول سلالة الليبوكالين. بالنسبة إلى الأشكال الأخرى ، تم قبول جميع البدائل حتى يصبح الشكل ساريًا في وقت لاحق في الشجرة ، وبعد ذلك تم قبول البدائل المطابقة للقيود الخاصة بالموضع فقط.

الجدول 3

مقارنة الأداء بين iSGv1.0 و ROSE و iSGv2.0 لمحاكاة عائلة Calycin Superfamily a

iSGv1.0الوردةiSGv2.0محاذاة الإدخال
هوية تسلسل النسبة المئوية19.7817.7214.6215.65
تم الحفاظ على مواقف عزر النسبة المئوية61.8261.8880.98& # x02014
عدد القوالب المخالفة لـ indels ب 13.1819.91 د 0& # x02014
عدد indels المرفوضة ج غير متوفرغير متوفر0.38& # x02014

لاحظنا آثارًا جانبية متعددة بسبب القيود التي يفرضها الرباعي الثابت و أنا + & # x003b3 صفيفات iSGv1.0 و ROSE ، على التوالي. كما هو موضح في الشكل 7 والشكل التكميلي S5 ، ظهرت المواد التكميلية عبر الإنترنت ، والزخارف المحفوظة في المحاذاة المتعددة & # x0201cislands & # x0201d حيث كانت indels غائبة. بالإضافة إلى ذلك ، تم الحفاظ على المواقع الثابتة مثل منطقة GXW في SCR1 لعمود المحاذاة بأكمله ، على الرغم من حقيقة أنه يجب حفظها فقط بين ليبوكلينات النواة وعائلة ليبوكالين الخارجية لبروتينات ربط الرائحة. قام iSGv1.0 أيضًا بمحاكاة عدد أقل من indels ، وهو أحد الآثار الجانبية لعدد مواضع المحاذاة التي تحتوي على مواضع عزر ، مما يقلل من عدد مواضع قبول indels. يبدو أن ROSE تستخدم العدد المطلق للمخلفات في التسلسل لحساب الاحتمال الإجمالي لـ indel لفرع ، بغض النظر عن عدد المواقع غير المقبولة لـ indels. الاختلافات في المواضع indel بين iSGv1.0 و ROSE مقابل iSGv2.0 واضحة أيضًا. كما هو مبين في الشكل 7 ، يحتوي iSGv2.0 على عدد أكبر بكثير من indels على طول منطقتي N و C من المحاذاة. هذا لأن هذه المناطق لديها قيود ضعيفة فقط على أحجامها: تم تقييد N-terminal على 10 & # x0201343 من المخلفات و C-terminal 10 إلى 30 من المخلفات. أثناء عملية المحاكاة ، حدد iSGv2.0 حجم indel ، واستنادًا إلى كل من قيود القالب والعنصر ، بحثت في التسلسلات للعثور على المناطق التي يمكن أن تقبل indel. تميل معظم indels الأكبر إلى الوقوع في المناطق الأقل تقييدًا. نظرًا لعدم امتلاك iSGv1.0 ولا ROSE لإمكانيات تقييد كهذه ، فقد تم وضع indels في أي مكان لم يتم حظره فيه بواسطة رباعي ثابت و أنا + & # x003b3 المصفوفات. علاوة على ذلك ، لا يمكن تصميم طية العائلة الفائقة بواسطة iSGv1.0 أو ROSE. لقد وضعوا في المتوسط ​​13.18 و 19.91 indels لكسر القوالب ، على التوالي (الجدول 3). أيدت iSGv2.0 قيود النموذج. في المتوسط ​​، تم رفض 0.35 indels لكل تشغيل محاكاة باستخدام iSGv2.0 نظرًا لوجود مواضع مقبولة محدودة لـ indels بسبب قيود القالب.

كان للمحاذاة المتعددة للإدخال (الشكل التكميلي S1 ، المواد التكميلية عبر الإنترنت) هوية تسلسل زوجي متوسط ​​يبلغ 15.65٪ (الجدول 3). النطاق 20 & # x0201335٪ من هوية التسلسل أو أقل هو ما يسمى & # x0201ctwilight zone & # x0201d من هوية التسلسل (Rost 1999) ، والتي غالبًا ما تُرى بين البروتينات التي تنتمي إلى عائلات شديدة التباين. مجموعات البيانات المحاكاة iSGv1.0 و ROSE و iSGv2.0 في هذا النطاق ، بمتوسط ​​قيم أكثر من 100 عملية 19.78٪ و 17.72٪ و 14.62٪ على التوالي. يفسر الاختلاف في هويات التسلسل بين iSGv1.0 و ROSE مقابل iSGv2.0 من خلال الحفظ العالمي للمواقع الثابتة بواسطة iSGv1.0 و ROSE ، حتى بالنسبة للتسلسلات بدون الزخارف الخاصة بالنسب. أظهر كل من iSGv1.0 و ROSE مواقع عزر أقل & # x0201cpercent محفوظة & # x0201d (الجدول 3) مما يشير إلى أن بعض المواضع تم الحفاظ عليها من قبلهم حتى لو لم تتوافق مع قيود البقايا لعائلات البروتين المختلفة.


المواد

فيما يلي قوالب لبعض قطع الكرتون التي ستحتاجها لهذا المعمل.

  • شرائط من الورق المقوى بعرض 6.5 سم تقريبًا (تمثل العظام)
  • قم بتقطيع شرائح الكرتون هذه إلى أطوال محددة لكل مجموعة معملية
    • 4x 20.5 سم
    • 4x 12.5 سم
    • 4x 7.5 سم
    • 4x 5 سم
    • 4x 3.5 سم
    • دائرة بقطر 5.5 سم "X"
    • دائرة بقطر 15 سم "عرض"
    • مربع بطول 5.5 سم "Y"
    • مربع بطول 2.5 سم “Z”

    التوفر والمتطلبات

    اسم المشروع:& # x003c0الحافلات الصفحة الرئيسية للمشروع:http://www.rega.kuleuven.be/cev/ecv/software/pibuss أنظمة التشغيل): منصة مستقلة لغة برمجة: جافا متطلبات اخرى: Java 1.5 أو أعلى ، مكتبة BEAGLE رخصة: جنو جي بي إل الصغرى أي قيود للاستخدام من قبل غير الأكاديميين: لا أحد.

    يتوفر كود المصدر لأداة BEAST / BEAGLE المتوازية لمحاكاة التسلسل مجانًا كجزء من مستودع BEAST Google Code: http://www.code.google.com/p/beast-mcmc/.

    تحتوي مكتبة أداة تقييم الاحتمالية العامة للتحليل التطوري (BEAGLE) ذات النظام الأساسي العريض على & # x02019s كلاً من كود المصدر والمثبتات الثنائية المتاحة من http://www.code.google.com/p/beagle-lib.

    البرامج النصية وملفات الإدخال المطلوبة لتكرار دراسة المحاكاة المعروضة في تطبيق مثال مستضافة على http://www.github.com/phylogeography/DeepRoot.


    ميجا 10.0

    MEGA التحليل الوراثي التطوري الجزيئي) هو أداة متكاملة لمحاذاة التسلسل التلقائي واليدوي ، واستنتاج أشجار النشوء والتطور ، وقواعد بيانات التعدين على شبكة الإنترنت ، وتقدير معدلات التطور الجزيئي ، واختبار الفرضيات التطورية.

    :: لقطات الشاشة

    :: المتطلبات

    :: معلومات اكثر

    مول بيول إيفول. 2013 30 ديسمبر (12): 2725-9. دوى: 10.1093 / مولبيف / mst197. Epub 2013 16 أكتوبر.
    MEGA6: التحليل الوراثي التطوري الجزيئي الإصدار 6.0.
    تامورا ك ، ستيتشر جي ، بيترسون د ، فيليبسكي أ ، كومار س.

    Tamura K و Peterson D و Peterson N و Stecher G و Nei M و Kumar S (2011)
    MEGA5: تحليل الوراثة التطورية الجزيئية باستخدام طرق الاحتمالية القصوى ، والمسافة التطورية ، وطرق البخل القصوى.
    علم الأحياء الجزيئي والتطور (2011) doi: 10.1093 / molbev / msr121 نُشر لأول مرة على الإنترنت: 4 مايو 2011

    اترك رد إلغاء الرد

    يستخدم هذا الموقع Akismet لتقليل البريد العشوائي. تعرف على كيفية معالجة بيانات تعليقك.


    أداة محاكاة تطور التسلسل - علم الأحياء

    NGSphy: محاكاة النشوء والتطور لبيانات تسلسل الجيل التالي

    © 2017 Merly Escalona ([email protected]) ، سارة روشا ، ديفيد بوسادا

    NGSphy هي أداة مفتوحة المصدر من Python لمحاكاة بيانات NGS على مستوى الجينوم (قراءة التهم أو قراءة Illumina) التي تم الحصول عليها من آلاف عائلات الجينات التي تتطور تحت شجرة أنواع شائعة ، مع عدد فردي من الصبغيات الفردية و / أو ثنائية الصبغيات لكل نوع ، حيث التسلسل يمكن أن يختلف عدم تجانس التغطية (العمق) باختلاف الأنواع والأفراد والمواقع ، بما في ذلك المواقع البعيدة عن الهدف وغير الملتقطة.

    تحاكي NGSphy عمليات القراءة (أو قراءة التهم) من المحاذاة التي نشأت من أشجار الجين الفردي أو توزيعات شجرة الجينات (التي نشأت من توزيعات شجرة الأنواع). وهي مصممة للقراءة مباشرة من SimPhy (محاكي تطور عائلة الجينات) في حالة توزيعات شجرة الجينات ، ولكن يمكن أيضًا تغذيتها بأشجار الجينات مباشرة. يمكن أن تحتوي هذه الأشجار على أخصائيي تقويم العظام والمشابهين وعلم xenologs. تتم محاكاة المحاذاة باستخدام غير قابل للتمثيل ويمكن أن تمثل أفرادًا أحاديًا و / أو ثنائيًا لكل نوع. بعد ذلك ، إما تقرأ Illumina (باستخدام ART) أو تتم محاكاة أعداد القراءة لكل فرد ، مع السماح بعمق التغطية بالتنوع بين الأنواع والأفراد والمواقع. تسمح هذه المرونة بمحاكاة كل من المواقع البعيدة عن الهدف (التي تم التقاطها ولكن ليست مستهدفة) وغير الملتقطة (مستهدفة ولكن لم يتم التقاطها).

    ستحتاج إلى ملف إعدادات NGSphy والملفات المطلوبة وفقًا لوضع الإدخال المحدد (انظر أدناه).


    أداة محاكاة تطور التسلسل - علم الأحياء

    تريفولفر هو برنامج Perl لمحاكاة تطور تسلسل الحمض النووي غير القابل للانعكاس على شجرة متشعبة ثابتة باستخدام سياق ثلاثي النوكليوتيدات. لا تعتمد على أي تبعيات خارجية ، مما يسهل النقل الأقصى. فقط قم بالتنزيل والتشغيل.

    لاختبار المحاكاة باستخدام بيانات المثال ، قم بتنفيذ البرنامج في سطر أوامر Unix أو Mac Terminal على النحو التالي:

    ابحث عن بعض الأمثلة الحقيقية أدناه. تحقق من طبعنا التمهيدي على bioRxiv.

    بيانات طفرة جديدة ، بما في ذلك من جديد الطفرات المكتشفة في تسلسل الجينوم الكامل لثلاثيات الأب / الأم والطفل ، يمكن استخدامها لتقدير معدلات الطفرات المعتمدة على السياق بشكل تجريبي. السياق الأكثر استخدامًا هو ثلاثي النوكليوتيدات ، حيث يُنظر إلى النوكليوتيدات المحيطة على جانبي الموضع (واحد 5 '، واحد 3'). لسوء الحظ ، لا توجد أداة لمحاكاة غير قابلة للعكس (بمعنى آخر.، معدلات غير متماثلة) تطور الحمض النووي على شجرة جينات ثنائية التشعب ثابتة (ثنائية الحل بالكامل) ، مثل تلك الناتجة عن محاكاة الاندماج. تريفولفر لملء هذه الفجوة. يجب على المستخدم توفير شجرة متشعبة ، تسلسل البذور ، مصفوفة معدل 64 × 4 (ثلاثي النوكليوتيد × نيوكليوتيد) ، ووحدة فرع (انظر الخيارات). تريفولفر يخرج تقرير SNP بتنسيق المتغير (VCF) لجميع أطراف الأشجار (أوراق الأصناف) ، بالإضافة إلى تاريخ الطفرات والزخارف لكل سلالة (انظر الإخراج).

    تريفولفر يبدأ بوضع تسلسل البذور على جذر الشجرة. ثم يشرع في اجتياز الشجرة بشكل متكرر من الجذر إلى الحافة باعتبارها بنية شجرة ثنائية مرتبة. بمعنى آخر ، في كل عقدة داخلية ، تقوم بمعالجة الطفل الأيسر (والطفل الأيسر وما إلى ذلك) قبل معالجة الطفل الأيمن ، حيث تُعتبر العقدة السفلية اليسرى (الأولى) هي تلك التي تأتي أولاً باستخدام الأبجدية ( لا رقمية) دالة الفرز (). يتم تعيين معرف العقدة الفريد كحرف 'n' متبوعًا بعدد صحيح (على سبيل المثال، n5) ، حيث يعتبر الجذر n = 0.

    عندما يتم مصادفة فرع واحد (على عكس الكتلة) ، تريفولفر يبدأ في تطوير التسلسل على طول الفرع. إذا كانت العقدة الأصلية للفرع هي الجذر أيضًا ، فسيتم استخدام تسلسل البذور (الأسلاف) كنقطة بداية. وبخلاف ذلك ، يتم إنشاء نسخة جديدة ومؤقتة من تسلسل البذور ، حيث يتم احتساب الأليل الأحدث في كل موقع متحور. هذا يحفظ ذاكرة الكمبيوتر ، لأن كل عقدة تحتاج فقط إلى أن ترث سجلها الطفري ، وليس تسلسلًا كاملاً ، من سلفها.

    بعد بدء تسلسل جديد على فرع ، يبدأ في التطور في ظل معدلات الطفرات المعتمدة على سياق ثلاثي النوكليوتيد المحددة بواسطة مدخلات المستخدم. مصفوفة معدل الطفرة في تريفولفر يتبع تنسيق محاكاة الوقت إلى الأمام معتدل البنيه (Haller and Messer 2019): 4 3 = 64 صفًا تتوافق مع الحالات الأولية لـ 64 ثلاثي النوكليوتيدات مرتبة أبجديًا ، بينما تتوافق الأعمدة الأربعة مع الحالات المشتقة المحتملة للنيوكليوتيدات المركزية. على سبيل المثال ، يجب أن يحتوي العمود الثالث من الصف الأول على معدل طفرة AAA➞AGA. معدلات الطفرة للهويات (على سبيل المثال، AAA➞AAA) يجب أن تكون 0.

    عندما يبدأ التطور على فرع ، تريفولفر يحسب أولاً معدل الطفرة الإجمالي لتسلسل الطول إل عن طريق حساب إل - 2 ثلاثي نيوكليوتيدات في التسلسل (بمعنى آخر.، يتم تجاهل النيوكليوتيدات الأولى والأخيرة ، التي تفتقر إلى سياق ثلاثي النوكليوتيدات). معدل الطفرة الكلي للتسلسل (ش) لحساب وقت انتظار عشوائي موزع أسيًا للطفرة التالية كـ زث = -(1 / ش) × ln (x1) الأجيال أين x هو رقم عشوائي بين 0 (شامل) و 1 (حصري) (يانغ 2014). إذا كان وقت الانتظار المتوقع (زث) أقل من طول الفرع ، تحدث طفرة. ثم يتم فحص التسلسل ثلاثي النوكليوتيد في كل مرة ، حتى يتجاوز معدل الطفرة التراكمية على طول التسلسل القيمة الثانية المختارة عشوائيًا بين 0 (شامل) و ش (باستثناء).ثم تحدث طفرة في الموضع المركزي لثلاثي النوكليوتيد الأول الذي ينطبق عليه هذا الشرط والذي يكون معدل الطفرات فيه أكبر من 0. وبسبب هذا الاعتماد على السياق ، من الممكن أن "تتآكل" ثلاثي النوكليوتيدات شديدة التغير بمرور الوقت ، و معدل الطفرة الإجمالي للتسلسل هو قيمة طارئة (وليست محددة مسبقًا) اعتمادًا على مصفوفة المعدل. في الواقع ، قد ينخفض ​​معدل الطفرة الإجمالي (أو يزيد) حتى يتم الوصول إلى تكوين توازن ثلاثي النكليوتيد.

    مكالمة تريفولفر باستخدام الخيارات التالية:

    - شجرة (مطلوب): ملف يحتوي على شجرة تطورية متشعبة بتنسيق newick بأطوال فرع. لا توجد أسماء أو قيم دعم في هذا الوقت. يتم استخدام أول شجرة مصادفة فقط ، بمعنى آخر.، يجب تنفيذ التحليلات الموازية المحرجة بمستوى واحد لأعلى.

    --seed_sequence (مطلوب): ملف FASTA يحتوي على تسلسل البداية (البذور) في جذر الشجرة ، ليتم تطويره. يتم استخدام التسلسل الأول المصادف فقط.

    --rate_matrix (مطلوب): ملف يحتوي على مصفوفة معدل ثلاثي النوكليوتيدات 64 × 4 محدد بعلامات جدولة حيث تكون الصفوف والأعمدة بالترتيب الأبجدي. على سبيل المثال ، تتوافق القيم الموجودة في الصف الأول مع AAA➞AAA و AAA➞ACA و AAA➞AGA و AAA➞ATA.

    --فرع_وحدة (مطلوب): عامل تحجيم يساوي 2ن0 أو 4ن0 في معظم عمليات المحاكاة المترابطة (على سبيل المثال, تصلب متعدد Hudson 2002) ، والتي يمكن ضربها بطول فرع للحصول على طول النسب في الأجيال. سيتم ضرب أطوال الفروع بهذه القيمة وتقريبها إلى أقرب عدد صحيح لتحديد عدد الأجيال. على سبيل المثال ، بالنظر إلى القيمة 144740 ، فإن طول الفرع البالغ 0.228826612 في شجرة النشوء والتطور يتوافق مع 144740 × 0.228826612 = 33.120.364 جيلًا.

    --البذور عشوائي (اختياري): عدد صحيح يتم بواسطته إنشاء مولد الأرقام العشوائية. إذا لم يتم توفيرها ، فسيتم اختيار أحدها والإبلاغ عنه. وبشكل أكثر تحديدًا ، نقوم بتنفيذ نهج المجموع الاختباري الوارد في برمجة بيرل:

    --tracked_motif (اختياري): حافز للتتبع بعد كل طفرة. على سبيل المثال ، للإبلاغ عن عدد مواقع CpG على مدار الجري ، حدد CG مثل: --tracked_motif = CG.

    --track_mutations (اختياري): يُبلغ عن معدل الطفرات ويُعد بمرور الوقت.

    --excluded_taxa (اختياري): مسار ملف يحتوي على قائمة بأسماء الأصناف (مفصولة بفواصل) ليتم التعامل معها على أنها مجموعات خارجية ، بمعنى آخر.، مستبعد من ملف VCF وتسلسل (تسلسلات) الإجماع. قد يكون هذا مرغوبًا إذا كان عدد قليل من الأصناف يمثل مجموعات خارجية ، والتي تتم مقارنة تعدد الأشكال في مجموعة داخلية.

    --أوتجروبس (اختياري): عدد المجموعات الخارجية ليتم استبعادها لتحديد أحدث سلف مشترك داخلي (MRCA) ولحساب الترددات المتغيرة للمجموعة في ملف VCF. تعتبر المجموعات الخارجية هي الأصناف الطرفية الأكثر تفرعًا (العقد الخارجية). على سبيل المثال ، إذا تم تحديد --outgroups = 2 ، فسيتم التنقل في الشجرة الثابتة بدءًا من الجذر. في كل عقدة داخلية ، يعتبر الفرع الذي يحتوي على أقل عدد من الأصناف الطرفية يحتوي على المجموعة (المجموعات) الخارجية. بمجرد تحديد العدد المحدد من قبل المستخدم من المجموعات الخارجية ، يتم تحديد أحدث عقدة سلف مشترك (MRCA) من الأصناف (الداخلية) المتبقية والإبلاغ عنها. في حالة عدم وجود مجموعة من تصنيفات المجموعة الخارجية غير التعسفية للرقم المحدد من قِبل المستخدم (على سبيل المثال، إذا تم استدعاء --outgroups = 2 ، لكن التقسيمين الأعمق يحتويان على ثلاثة بدلاً من تصنيفين) ، تتم طباعة تحذير ولا يتم استخدام مجموعات خارجية.

    --حرق في (اختياري): عدد الأجيال التي يجب أن "تحترق في" تطور التسلسل قبل بدء التطور عند جذر الشجرة. لاحظ أن هذا يقاس بالعدد المطلق للأجيال ، ليس في وحدات الفرع. الممارسة القياسية هي 10ن أو 20ن أجيال أين ن هو حجم السكان (الفعال).

    --vcf_output (اختياري): اسم ملف الإخراج بتنسيق VCF الذي سيتم إنشاؤه في دليل العمل ، ما لم يتم إعطاء اسم المسار الكامل. إذا لم يتم تحديده ، فسيتم طباعة ملف في دليل العمل بامتداد .vcf باستخدام اسم ملف الشجرة كبادئة.

    --suppress_seed_seq (اختياري): قم بإلغاء طباعة تسلسل الأسلاف (البذور) في الإخراج. قد يكون هذا مرغوبًا إذا كان التسلسل الأولي كبيرًا جدًا وكان تضمينه في الإخراج يستهلك مساحة كبيرة جدًا على القرص.

    --suppress_MRCA_seq (اختياري): يمنع طباعة تسلسل MRCA (أحدث سلف مشترك).

    --suppress_consensus_seq (اختياري): يمنع طباعة تسلسل الإجماع (الذي يحتوي على أليل REF ، المحدد هنا على أنه الأليل الرئيسي ، في كل موقع).

    --suppress_MUTATION (اختياري): يمنع طباعة // بيانات MUTATION.

    - الإسراف (اختياري): أخبر Trevolver بالإبلاغ عن كل ما يحدث. لا ينصح به إلا لأغراض التطوير والتصحيح.

    تتوفر أمثلة ملفات الإدخال والإخراج في أدلة EXAMPLE_INPUT و EXAMPLE_OUTPUT في صفحة GitHub هذه ، حيث يتم ترقيم الأمثلة القابلة للتكرار (على سبيل المثال, output_example1.txt). عندما لا يتم تحديد البذور العشوائية ، يمكن إعادة إنتاج النتائج الدقيقة باستخدام نفس الرقم الأولي العشوائي المذكور في ملف الإخراج الموجود في EXAMPLE_OUTPUT. لاحظ أنه إذا كان ملف (ملفات) الإدخال الخاص بك (على سبيل المثال, Tree_6taxa.txt) ليست في دليل العمل (بمعنى آخر.، حيث تعمل الوحدة الطرفية حاليًا) ، ستحتاج إلى تحديد المسار الكامل لاسم الملف (على سبيل المثال, / المستخدمون/ohta/Desktop/trevolver_practice/tree_6taxa.txt). لاحظ أيضًا أنه في الأمثلة أدناه ، يتم استخدام a ببساطة لمتابعة الأمر السابق على السطر.

    مثال 1: محاكاة بسيطة

    مثال 2: محاكاة بسيطة بحرق 1000 جيل

    مثال 3: الاستخدام النموذجي (يقرر البرنامج أن البذور العشوائية ليست مطولة)

    المثال 4: المحاكاة مع مخرجين

    مثال 5: تطوير تسلسل واحد لمليون جيل

    لمحاكاة تطور تسلسل واحد ، وفر للشجرة تصنيفًا واحدًا وطول فرع. على سبيل المثال ، لمحاكاة تطور تسلسل واحد يسمى "my_creature" لمليون جيل ، سيحتوي ملف الشجرة ، ببساطة ، (my_creature: 1000000). قدم عامل تحجيم (- فرع_وحدة) بقيمة 1 ، ومن الجيد أن تبدأ:

    مثال 6: تم استخدام العديد من الخيارات

    مثال 7: الحد الأدنى من الخيارات مع إخراج للشاشة

    سيؤدي هذا تلقائيًا إلى إنشاء ملف VCF باسم Tree_7taxa.vcf في دليل العمل.

    اعتمادًا على الخيارات المحددة ، تريفولفر ستخرج البيانات التالية:

    ستبلغ بداية الإخراج:

    • الأمر: كيف تم استدعاء Trevolver.
    • RANDOM_SEED: البذور العشوائية المستخدمة.
    • INPT_SEQUENCE: تسلسل النوكليوتيدات المستخدم كمدخل.
    • SEED_SEQUENCE: تسلسل النوكليوتيدات المستخدم لبذر المحاكاة. إذا لم يكن هناك وقت احتراق ، فهذا مطابق لـ INPT_SEQUENCE.
    • MRCA_SEQUENCE: تسلسل النوكليوتيدات من مجموعة MRCA (أحدث سلف مشترك).
    • CONS_SEQUENCE: تسلسل النوكليوتيدات الإجماعي للمجموعة في نهاية المحاكاة (بمعنى آخر.، نصائح شجرة).
    • الشجرة: الشجرة الثابتة التي حدثت عليها المحاكاة.
    • MRCA_GENERATION: الجيل (من الوقت 0 عند الجذر) الذي عاش فيه أحدث سلف مشترك (MRCA) للمجموعة الداخلية.
    • MRCA_SUBTREE: الشجرة الفرعية التي يكون MRCA هو الجذر لها.
    • OUTGROUPS: أسماء المجموعات الخارجية ، إن وجدت.
    • MRCA_NODE_ID: معرف عقدة MRCA.
    • VCF_OUTPUT_FILE: اسم ملف إخراج VCF.

    بالإضافة إلى ذلك ، بعد موجز ملخص النتائج، تشير العلامات التالية إلى أقسام منفصلة بمخرجات أكثر تفصيلاً:

    • // MUTATION: تحتوي الأسطر التالية على تاريخ طفرة كامل مع ثلاثة أعمدة: التصنيف ، والموقع ، والطفرة. بيانات عمود الطفرة في تنسيق [جيل] - [أليل سلفي] & gt [أليل مشتق]. على سبيل المثال ، سيتم إدراج طفرة C & gtT التي حدثت في الجيل 1،988 على أنها 1988-C & gtT.
    • // TRACKED: تحتوي الأسطر التالية على معدلات طفرة متتبعة و / أو بيانات نموذجية بخمسة أعمدة: النسب ، والتوليد ، ومعدل الطفرات ، و mutation_count ، و motif_count.

    يتوافق إخراج تنسيق الاستدعاء المتغير (VCF) مع تنسيق VCFv4.1 ، مثل المستخدم بواسطة إصدار 1000 Genomes Project GRCh38 / hg38 ، مع بعض الاستثناءات الملحوظة. للراحة وقابلية التكرار ، يتم استخدام رؤوس بيانات وصفية إضافية (الأسطر التي تبدأ بـ ##) للإشارة إلى الوسيطات المستخدمة كـ تريفولفر المدخلات والنتائج الرئيسية ومواصفات التجربة ، بما في ذلك تلك الموضحة في المخرجات القياسية بالإضافة إلى:

    • burn_in_mutations: العدد الإجمالي للطفرات خلال فترة الاحتراق.
    • total_mutations: العدد الإجمالي للطفرات على جميع الفروع (باستثناء الاحتراق).
    • طول الشجرة: إجمالي طول الفرع (الأجيال).
    • طول_التجربة: ارتفاع الشجرة ، بمعنى آخر.، طول الجذر إلى الحافة (الأجيال). مطلوب حاليًا أن تكون جميع الأطوال من الجذر إلى الحافة ، المقاسة بالأجيال ، متساوية.
    • simulation_time: مدة التشغيل (بالثواني).

    الرؤوس غير ذات الصلة (على سبيل المثال، واصفات متغير النوكليوتيدات غير المفردة). تتم طباعة تسلسلات المدخلات ، والبذور ، والإجماع (ingroup) ، و MRCA (ingroup) في البيانات الوصفية للرأس لتسهيل الأمر ما لم يتم استدعاء --suppress_input_seq ، --suppress_seed_seq ، --suppress_consensus_seq ، أو --suppress_MRCA_seq. بالإضافة إلى ذلك ، تمت إضافة العديد من أنواع البيانات (العديد منها غير معروف في التحليلات التطورية الواقعية) إلى عمود INFO:

    • REF / REF_OG: أليل الإجماع (الرئيسي) للمجموعة (المجموعات) الخارجية ، والتي قد تتطابق أو لا تتطابق مع AA (أليل الأسلاف).
    • AA: أليل أسلاف شجرة كاملة (أليل تسلسل البذور).
    • MRCA: أليل السلف المشترك الأحدث (MRCA) فيما يتعلق بالمجموعة ، إذا تم استخدام --outgroups.
    • MUTATIONS / MUTATIONS_OG: جميع الطفرات الفريدة التي حدثت في هذا الموقع ، على سبيل المثالو G & GTA. يتم فصل الطفرات المتعددة بفواصل (على سبيل المثال، G & gtA، A & gtG) بتنسيق ترتيب زمني، للراحة في تحليلات المصب. إذا تم تحديد المجموعات الخارجية أو الأصناف المستبعدة ، تشير MUTATIONS إلى المجموعة الداخلية فقط ، بينما تشير MUTATIONS_OG إلى المجموعة (المجموعات) الخارجية فقط.
    • GENERATIONS / GENERATIONS_OG: الوقت (الجيل) الذي حدثت فيه الطفرة (الطفرات) الفريدة ، مفصولة بفواصل في نفس الترتيب (كرونولوجي). إذا تم تحديد المجموعات الخارجية أو الأصناف المستبعدة ، فإن GENERATIONS تشير إلى الداخل فقط ، بينما GENERATIONS_OG تشير إلى الخارج فقط.
    • TAXA / TAXA_OG: عدد الأصناف التي تشترك في الطفرة (الطفرات) الفريدة ، مفصولة بفواصل في نفس الترتيب (كرونولوجي). إذا تم تحديد المجموعات الخارجية أو الأصناف المستبعدة ، تشير TAXA إلى المجموعة الداخلية فقط ، بينما تشير TAXA_OG إلى المجموعة (المجموعات) الخارجية فقط.
    • ARBITRARY_REF: علامة تشير إلى وجود رابط للأليل الرئيسي / الإجماع / الأكثر شيوعًا في هذا الموقع. إذا كان أعلى تردد للأليل مشترك بين أليلين ، فسيتم الإبلاغ عن الذي يأتي أولاً أبجديًا.
    • MULTIHIT / MULTIH_OG: أعلام تشير إلى أن موقعًا قد تعرض لأكثر من طفرة واحدة ، إما في نفس النسب أو في سلالة مميزة ، في مجموعة / مجموعات خارجية.
    • MULTIALLELIC / MULTIA_OG: علامات تشير إلى أن الموقع يحتوي على عدة أليلات ثانوية (غير مرجعية) (بمعنى آخر.، & gt2 alleles) في مجموعة / مجموعات خارجية. جميع المواقع متعددة المواقع متعددة الأضلاع ، لكن العكس ليس صحيحًا.
    • BACK_MUTATION / BACK_M_OG: علامة تشير إلى أن موقعًا قد تعرض لطفرة في الظهر ، والعودة إلى الحالة / الأليل السابق ، في مجموعة / مجموعات خارجية. تعرضت جميع المواقع ذات الطفرة الخلفية لضربات متعددة ، لكن العكس ليس صحيحًا.
    • RECURRENT_MUTATION / RECURRENT_M_OG: علامة تشير إلى أن موقعًا قد تعرض لطفرة متكررة ، أي أن نفس التغيير يحدث عدة مرات بشكل مستقل ، في مجموعة / مجموعات خارجية.
    • INVARIANT_ANCESTRAL: علامة تشير إلى أن الموقع لا يحتوي على تعدد الأشكال في أوراق الداخل (الأصناف الموجودة) ، وأن الحالة الثابتة تطابق أليل الأسلاف (AA). وهكذا ، حتى لو حدثت طفرة في تاريخ الموقع ، فقد الأليل المشتق عن طريق الطفرة الخلفية.
    • INVARIANT_DERIVED: علامة تشير إلى أن الموقع لا يحتوي على تعدد الأشكال في أوراق المجموعة (الأصناف الموجودة) ، وأن الحالة الثابتة تطابق أليلًا مشتقًا ناتجًا عن طفرة. هذا يعني أن جميع التسلسلات الداخلية الموجودة تنحدر من سلف متحور.
    • NO_ANCESTRAL: علامة تشير إلى عدم بقاء أليلات أسلاف (بذرة) في الأفراد الموجودين في المجموعة. لاحظ أن هذا يتوافق مع وجود تعدد الأشكال ، طالما لم يتطابق أي من الأليلات مع أليل الأسلاف.
    • REF_OG: أليل الإجماع (الرئيسي) للمجموعة (المجموعات) الخارجية ، والتي قد تتطابق أو لا تتطابق مع AA.
    • REF_OG_COUNT: عدد أليل المجموعة الخارجية المطابق لإجماع المجموعة الخارجية.
    • REF_OG_AF: تكرار أليل المجموعة الخارجية المطابق لإجماع المجموعة الخارجية.
    • ALLELES_OG: قائمة مفصولة بفواصل لجميع الأليلات الموجودة في المجموعة (المجموعات) الخارجية.
    • ALLELE_COUNTS_OG: قائمة مفصولة بفواصل لكل عدد الأليلات الموجودة في المجموعة (المجموعات) الخارجية ، بنفس ترتيب ALLELES_OG.
    • OG_FIXED: علامة تشير إلى أن موقعًا ثابتًا لأليل واحد (بمعنى آخر.، ليس له اختلاف) في المجموعة (المجموعات) الخارجية. سيكون هذا صحيحًا بالتعريف إذا كان هناك فقط خارج المجموعة. لاحظ أنه يمكن استرجاع ترددات أليلات المجموعة الخارجية من بيانات ALLELE_COUNTS_OG.
    • OG_DIVERGED: علامة تشير إلى واحد أو أكثر من أليلات المجموعة الخارجية يختلف عن أليلات واحدة أو أكثر. قد تكون المجموعات الخارجية متباعدة عن المجموعة الداخلية ولكنها غير ثابتة.
    • OG_SHARE: علامة تشير إلى واحد أو أكثر من الأليلات الخارجة عن المجموعة اعواد الكبريت أليلات واحدة أو أكثر. قد تشترك المجموعات الخارجية في الأليلات مع المجموعة الداخلية ولكن لا يتم إصلاحها.

    إذا كان لديك أسئلة حول تريفولفر، يرجى النقر فوق علامة التبويب "المشكلات" أعلى هذه الصفحة وبدء سلسلة رسائل جديدة ، حتى يستفيد الآخرون من المناقشة. سيتم تناول الأسئلة الشائعة في هذا القسم.

    تريفولفر تمت كتابته بدعم من زمالة Gerstner Scholars من Gerstner Family Foundation في المتحف الأمريكي للتاريخ الطبيعي إلى C.W.N. (2016-2019) ، ويتم الحفاظ عليها بدعم من زمالة 中央研究院 Academia Sinica لأبحاث ما بعد الدكتوراه (2019-2021). تم تصميم صورة الشعار بواسطة Mitch Lin (2019) حلزون DNA خالي من حقوق الطبع والنشر تم الحصول عليه من Pixabay. بفضل ريد أ. كارترايت ، ومايكل دين ، ودان جراور ، ومينغ هسويه لين ، وليزا ميرابيلو ، وسيرجيوس أوريستيس-كولوكوترونيس ، ومايكل تيسلر ، وميريديث ييغر للمناقشة.

    عند استخدام هذا البرنامج ، يرجى الرجوع إلى والاستشهاد بما يلي:

    نيلسون سي دبليو ، فو واي ، لي دبليو إتش. تريفولفر: محاكاة تطور تسلسل الحمض النووي غير القابل للعكس في سياق ثلاثي النوكليوتيدات على شجرة متفرعة. bioRxiv دوى: https://doi.org/10.1101/672717

    إذا كان لديك أسئلة حول تريفولفر، يرجى النقر فوق علامة التبويب "المشكلات" أعلى هذه الصفحة وبدء سلسلة رسائل جديدة ، حتى يستفيد الآخرون من المناقشة.

    يجب توجيه المراسلات الأخرى إلى Chase W. Nelson:

    • Haller BC ، Messer PW. 2019. SLiM 3: عمليات محاكاة جينية متقدمة تتجاوز نموذج رايت فيشر. علم الأحياء الجزيئي والتطور36:632–637.
    • هدسون ر. 2002. توليد عينات تحت نموذج رايت - فيشر المحايد للتنوع الجيني. المعلوماتية الحيوية18:337–338.
    • يانغ زد .2014. التطور الجزيئي: نهج إحصائي. نيويورك ، نيويورك: مطبعة جامعة أكسفورد.


    شاهد الفيديو: شرح كيف تدافع مثل المحترفين في لعبة بيس 2021 (شهر اكتوبر 2022).