معلومة

لماذا يختلف الأفراد في عدد تعدد الأشكال في جين معين (مثل FOXO3A)؟

لماذا يختلف الأفراد في عدد تعدد الأشكال في جين معين (مثل FOXO3A)؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

الفرد # 1 ، التسلسل بواسطة 23andMe ثم إدخاله في Promethease لبيانات SNP لديه مخرجات SNP التالية:

1) rs1935949 (C ؛ T) 2) rs2802292 (G ؛ T) 3) rs13217795 (C ؛ T) 4) rs13220810 (C ؛ T) 5) rs2764264 (C ؛ T) 6) rs9400239 (C ؛ T) 7) rs2153960 (C ؛ T) 8) rs2802288 (A ؛ G)

وبالتالي فإن الفرد رقم 1 لديه ثمانية تعدد أشكال النيوكلوتايد.

يتم أيضًا تسلسل الفرد 2 بواسطة 23andMe ثم إدخاله في Promethease لبيانات SNP لديه ناتج SNP التالي:

1) rs2802292 (T ؛ T) 2) rs2764264 (T ؛ T)

لذلك فإن الفرد رقم 1 لديه ثمانية تعدد أشكال SNPs تم الإبلاغ عنها لجين FOXO3A والفرد رقم 2 لديه اثنين فقط من تعدد الأشكال.

نظرًا لأن SNPs تمثل تعدد أشكال النوكليوتيدات المفردة في التسلسل ، فلماذا الفرد رقم 2 لديه فقط تعدد أشكال SNPs مسجل بدلاً من كل ثمانية؟


نسخ رقم الاختلاف

نسخ رقم الاختلاف (CNV) هي ظاهرة تتكرر فيها أقسام الجينوم ويختلف عدد التكرارات في الجينوم بين الأفراد. [1] تباين رقم النسخ هو نوع من التباين الهيكلي: على وجه التحديد ، هو نوع من حدث الازدواج أو الحذف الذي يؤثر على عدد كبير من الأزواج الأساسية. [2] يمكن أن يتكون ما يقرب من ثلثي الجينوم البشري بأكمله من التكرارات [3] ويمكن تصنيف 4.8 - 9.5٪ من الجينوم البشري على أنها تغيرات في عدد النسخ. [4] في الثدييات ، تلعب الاختلافات في عدد النسخ دورًا مهمًا في توليد الاختلاف الضروري في السكان بالإضافة إلى النمط الظاهري للمرض. [1]

يمكن تصنيف تباينات رقم النسخ بشكل عام إلى مجموعتين رئيسيتين: التكرارات القصيرة والتكرارات الطويلة. ومع ذلك ، لا توجد حدود واضحة بين المجموعتين ويعتمد التصنيف على طبيعة المواقع محل الاهتمام. تتضمن التكرارات القصيرة بشكل أساسي تكرارات ثنائية النوكليوتيدات (نيوكليوتيدات متكررة مثل A-C-A-C-A-C.) وتكرار ثلاثي النوكليوتيدات. تتضمن التكرارات الطويلة تكرارات جينات كاملة. هذا التصنيف الذي يعتمد على حجم التكرار هو أكثر أنواع التصنيف وضوحًا حيث أن الحجم عامل مهم في فحص أنواع الآليات التي من المرجح أن تؤدي إلى التكرارات ، [5] ومن ثم التأثيرات المحتملة لهذه التكرارات على النمط الظاهري.


الطب الشرعي والعلوم

رونالد جي ترينت دكتوراه ، بكالوريوس (ميد) ، بكالوريوس بكالوريوس (سيدني) ، DPhil (Oxon) ، FRACP ، FRCPA ، في الطب الجزيئي (الإصدار الثالث) ، 2005

الأقمار الصناعية الدقيقة

تعدد أشكال الحمض النووي المستخدمة الآن في حالة الطب الشرعي هي السواتل الميكروية التي يطلق عليها أيضًا STRs لتكرار الترادف القصير أو SSRلتكرار التسلسل البسيط (انظر الشكل 9.2). تتكون VNTRs الموضعية المفردة هذه من وحدات نيوكليوتيدات بسيطة متكررة بشكل مترادف تتكون من حوالي 2-6 أزواج قاعدية. أفضل وصف هو تكرار ثنائي النوكليوتيد الذي يتضمن قواعد مثل الأدينين والسيتوزين (AC)ن، حيث n (عدد التكرارات الموجودة) يختلف من 10-60. لأغراض الطب الشرعي ، يُفضل تكرار ثلاثي ورباعي - على سبيل المثال (AACT)ن- لأنها تنتج نتائج مرضية أكثر من الناحية الفنية. تحدد كل STR قطعة فريدة من الجينوم. تعتبر السواتل المكروية ، بسبب قابليتها للتغير المفرط المحتملة ، أكثر إفادة من نظام RFLP الثنائي ، ولكنها أقل من السواتل الصغيرة. ومع ذلك ، يمكن فحص السواتل المكروية بواسطة تفاعل البوليميراز المتسلسل ، وتزداد قيمتها أو قدرتها على المعلومات عن طريق قياس عدد منها وإضافة المعلومات التي تم الحصول عليها من كل علامة.

اليوم ، قد يكون من المحرج أحيانًا عرض ملف DNA قديم للأقمار الصناعية الصغيرة تم تقديمه كأدلة منذ 10-15 عامًا. اعتمادًا على معيار معمل اختبار الحمض النووي ، يمكن أن تكون جودة اللطخة الجنوبية عادية جدًا ، وغالبًا ما تكون التحولات الشريطية موجودة. تشير تحولات النطاق إلى الحركات المختلفة لنفس جزء الحمض النووي. تحدث بسبب عيوب في المواد الهلامية مما يؤدي إلى رحلان كهربائي غير منتظم. ومع ذلك ، أصبحت هذه المشكلات الفنية الآن شيئًا من الماضي كنتيجة لإنتاج مجموعات محلل الحمض النووي تجاريًا. يتم التحقق من صحة هذه المجموعات ومراقبة الجودة ، ويمكن البحث عن نفس الأشكال المتعددة للحمض النووي في مختبرات مختلفة ، مما يسهل تنفيذ تدابير مراقبة الجودة الداخلية والخارجية ومقارنة البيانات (انظر الإطار 9.1). يمكن إعادة فحص نتائج العينات الاستدلالية في وقت لاحق أو بواسطة مختبر مستقل بسبب استخدام تفاعل البوليميراز المتسلسل. في السابق ، لم يكن هذا خيارًا مع الأقمار الصناعية الصغيرة لأن معظم الحمض النووي من مسرح الجريمة كان سيُستخدم في اختبار لطخة الجنوب الأولي. يسمح PCR أيضًا باستخدام الأتمتة ، وبالتالي لم يعد تحجيم شظايا الحمض النووي يتم بصريًا ولكن باستخدام برنامج احتكاري ، وبالتالي زيادة دقة واستنساخ بصمة الحمض النووي (الشكل 9.3).

الشكل 9.3. القياسات الآلية لأحجام أشرطة الحمض النووي. لتحديد حجم جزء الحمض النووي الذي تم الحصول عليه بواسطة PCR ، يمكن الآن استخدام تحجيم الشظايا الآلي المعتمد على الكمبيوتر. يضمن هذا النهج كلاً من الدقة وقابلية التكاثر. (1) يُظهر كل تعدد أشكال الحمض النووي (SNP) يمكن اكتشافه بواسطة PCR. في المجموع ، يمكن مضاعفة سبعة أشكال مختلفة من SNP ، وبالتالي يتم اكتشافها باستخدام PCR واحد. بعد ذلك ، يتم عزل منتجات PCR بالكهرباء وتمييزها عن بعضها البعض على أساس حجم الشظية. عندما يكون هناك تداخل في الأحجام (على سبيل المثال ، الشظايا أ و ب) ، يتم تمييز البادئات الخاصة بـ PCR بألوان مختلفة ، وبالتالي تظل الأجزاء ذات الحجم نفسه تقريبًا قابلة للتمييز. كل جزء لديه القدرة على الحصول على أليلين مختلفين على سبيل المثال ، a و c و d و e أليلات لنفس الشظيتين. يمكن فصل هذه الأليلات على أساس الحجم واللون ، وبالتالي تعزيز دقة الرحلان الكهربائي. (2) يوضح هذا الرسم البياني قياسات ضمان الجودة المنتظمة على مدى ستة أشهر لأربعة أجزاء من الحمض النووي في نطاق الحجم من 55 إلى 65 زوجًا قاعديًا. يؤكد الرسم البياني إمكانية استنساخ الرحلان الكهربائي للحمض النووي مع انحراف ضئيل للغاية خلال هذه الفترة الزمنية.


علم الأحياء / DNA

النوكليوتيدات المفردة

SNPs هي بدائل قاعدة واحدة موجودة في الجينوم. غالبية SNPs ثنائية النواة ، ولكن تم الإبلاغ أيضًا عن تعدد الأشكال الثلاثية الأليلية ورباعية الأليلات.

تكمن مزايا استخدام النيوكلوتايد في أعمال الطب الشرعي والدراسات الجينية السكانية في وفرتها في الجينوم - يمكن أن يُنسب ما يقرب من 85٪ من التباين الجيني البشري إلى تعدد الأشكال.

بالمقارنة مع تقارير المعاملات المشبوهة ، فإن هذه العلامات لديها معدلات طفرة أقل (حوالي 2 × 10 8) ، وبالتالي فهي أكثر استقرارًا ، مما يجعلها أكثر ملاءمة للاستخدام في تحليلات القرابة وفي الظروف التي تتطلب إعادة بناء النسب / النسب.

يمكن أيضًا تضخيم النيوكلوتايد في أجزاء قصيرة من حوالي 60-80 بت في الثانية. وهذا يجعلها مفيدة جدًا في العينات القديمة ذات قالب الحمض النووي بكميات منخفضة ، و / أو في العينات المتدهورة حيث يتم تجزئة الحمض النووي المتاح. في هذه الحالات ، من المرجح أن ينتج عن تحليل SNPs نتائج أفضل من التنميط الجيني STR.

حقيقة أن معظم SNPs هي biallelic يقلل من المعلوماتية لكل موقع عند مقارنتها بتقارير المعاملات المشبوهة (

10–13 SNPs ضرورية للحصول على نفس قوة التمييز مثل STR). على الرغم من أن SNPs لن تحل في النهاية محل تقارير المعاملات المشبوهة المستخدمة حاليًا ، إلا أنه يمكن استخدامها كأداة تكميلية ، مما يزيد من المعلومات المتاحة.

اعتمادًا على الخصائص والموقع في الجينوم والتنوع الجيني ل SNP معين داخل وبين السكان ، يمكن استخدام تحليل SNP في تحديد الهوية الفردية والاستدلال الظاهري ودراسات النسب أو النسب.

يعد مشروع HapMap الدولي أحد أهم الدراسات التي تُبلغ عن المتغيرات الجينية الشائعة التي تحدث في مجموعات بشرية مختلفة. بالفعل في المرحلة الثالثة ، ساهمت قاعدة بيانات HapMap في زيادة كثافة تعدد الأشكال المعروفة عبر الجينوم البشري ، وقد أبلغت عن أكثر من 10 ملايين تعدد الأشكال غير المتكرر حتى الآن. تتضمن قاعدة بيانات SNP من المركز الوطني لمعلومات التكنولوجيا الحيوية (dbSNP www.ncbi.nlm.nih.gov/) حاليًا أكثر من 400000 من تعدد الأشكال الخاصة بالكروموسوم X والتي تم التحقق من صحتها ومتاحة لتطبيقات متعددة.

في الوقت الحالي ، تم نشر القليل من البيانات حول استخدام الكروموسوم X SNP في تحليل الطب الشرعي ، على الرغم من أن بعض الدراسات قد أظهرت بالفعل قابليتها للتطبيق في اختبار العلاقة وتوصيف السكان. ستشهد هذه المنطقة نموًا كبيرًا في السنوات القادمة ، حيث يتم تطوير المزيد من منهجيات تصنيف SNP المؤتمتة والسريعة.


نتائج

عدد النيوكلوتايد لكل جين

يتضمن Affymetrix 500K GeneChip ما يقرب من 500000 SNPs موزعة على الجينوم بأكمله. نقوم بتعيين SNPs هذه لأقرب جين لترميز البروتين إذا كان SNP يقع على بعد أقل من 40 كيلو بايت من الجين. تم تعيين ما يقرب من 290،000 تعدد الأشكال في الجينات ، منها 227000 تركت بعد مراقبة الجودة لمجموعات بيانات مرضية محددة (الجدول 1). تختلف الجينات بشكل كبير في الحجم ، مما يؤدي إلى أعداد مختلفة من SNPs المخصصة لكل جين (الشكل 1). من 20،919 جينًا لترميز البروتين ، يوجد 17،006 جينًا واحدًا على الأقل من SNP ، ومعظم هذه الجينات (∼77 ٪ أو 13083 جينًا) لديها أقل من 10 SNPs 6.5 ٪ (1097 جينًا) لديها أكثر من 50 SNPs. أكبر عدد من SNPs المخصص لجين واحد هو 1008 (CSMD1، طول الجين: 818 كيلو بايت).

قمنا بتعيين SNPs في مجموعة التنميط الجيني Affymetrix 500K لجينات ترميز البروتين. تم تخصيص SNPs للجين إذا كانت موجودة داخل المنطقة المكتوبة أو داخل نافذة مجاورة تبلغ 40 كيلو بايت حول المنطقة المنسوخة. حيث تم تعيين النوافذ المرافقة المتداخلة SNPs لأقرب جين لها فقط.

أجرينا تحليلات لبيانات GWAS لكل من مرض كرون (CD) ومرض السكري من النوع 1 (T1D). في القسم التالي نقدم نتائج القرص المضغوط. نتائج T1D قابلة للمقارنة ومعروضة في مادة تكميلية.

اشتقاق إحصائية اختبار على مستوى الجين لكل جين

لقياس ارتباط SNP بالمرض ، نقارن ترددات النمط الجيني بين الحالات والضوابط ونحسب إحصائية اختبار مصححة بالضبط الجيني بناءً على اختبار اتجاه Armitage لكل SNP. للحصول على مقياس ارتباط على مستوى الجينات ، نشتق أولاً ثلاثة إحصاءات موجزة: maxT (أقصى إحصاء اختبار لكل جين) ، عنى (متوسط ​​إحصاء الاختبار لكل جين) ، و أعلى (متوسط ​​الربع الأعلى لجميع إحصائيات الاختبار في الجين). نوضح هنا كيف تخضع كل إحصائية موجزة لعوامل مربكة يجب التحكم فيها. يرتبط إحصاء الاختبار على مستوى الجين بعدد SNPs لكل جين ، ن (الشكلان 2 و S1) على النحو التالي.

  • ل maxT تزداد إحصائية الاختبار خطيًا تقريبًا مع ن (معامل ارتباط بيرسون ص = 0.36). حتى إذا لم يكن هناك ارتباط ، فمن المرجح أن يكون للجينات التي تحتوي على العديد من تعدد أشكال النوكليوتيدات SNPs ذات إحصائية اختبار عالية ، عن طريق الصدفة.
  • تأثير مختلف يحدث ل عنى، حيث تميل الجينات التي تحتوي على العديد من SNPs إلى الحصول على إحصائيات اختبار على مستوى الجينات قريبة من واحد ، في حين تميل الجينات التي تحتوي على عدد قليل من SNPs إلى أن تكون في أقصى حدود التوزيع ، أي أن يكون لديها إحصائيات اختبار على مستوى الجين منخفضة جدًا أو عالية جدًا. تحت الفرضية الصفرية لعدم وجود ارتباط ، فإن إحصائية الاختبار لها χ1 2 ، بمتوسط ​​1. عند حساب المتوسط ​​T ، من المحتمل أن يكون للجينات التي تحتوي على عدد أكبر من SNPs إحصائيات اختبار على مستوى الجينات قريبة من 1 ، في حين أن الجينات التي تحتوي على عدد قليل من SNPs تتأثر بشكل أكبر بتعدد الأشكال الفردية مع إحصائية اختبار متطرفة.
  • لوحظ تأثير مشابه لمتوسط ​​T أعلى: تميل الجينات التي تحتوي على عدد أقل من SNPs إلى الحصول على إحصائيات اختبار واسعة النطاق للجينات ، بينما تميل الجينات التي تحتوي على العديد من SNPs إلى الحصول على إحصائية اختبار على مستوى الجينات قريبة من χ 2 ≈3. هذه القيمة أعلى من طريقة المتوسط ​​T حيث يتم تحديد أعلى 25٪ فقط من تعدد الأشكال لكل جين.

يتم دمج إحصائيات الاختبار المتعددة لكل جين باستخدام ثلاث طرق مختلفة (maxT ، meanT ، topQ). لكل طريقة ، يرتبط إحصاء الاختبار على مستوى الجين بعدد SNPs لكل جين. بالنسبة لهذه الرسوم البيانية ، يتم إهمال الجينات وفقًا لإحصائية الاختبار على مستوى الجين (المحور الأيسر). توضح النقاط الحمراء متوسط ​​عدد SNPs لكل جين لكل حاوية (المحور الأيمن).

اشتقاق قيمة احتمالية لكل جين

توزيع الإحصائيات الموجزة لكل جين غير معروف ومن المستحيل اشتقاقه بشكل تحليلي ، لأنه يعتمد على نمط صعوبة التعلم داخل كل جين. لذلك فإننا نشتق قيمة p تجريبية صإمبراطورية لكل جين من مجموعات البيانات المخففة (انظر الطرق). من خلال مقارنة ما تمت ملاحظته مع إحصائيات الاختبار المخالفة ، نحافظ على بنية LD ونحسب الاختلافات في عدد SNPs لكل جين. الملاحظة صإمبراطورية يتم التحكم في القيم بشكل مناسب لعدد SNPs لكل جين ، ولا نلاحظ أي ارتباط بين عدد SNPs لكل جين و صإمبراطورية القيمة (الشكلان 3 و S2). لكل طريقة من الطرق الثلاث لدمج إحصائيات الاختبار ، فإن صإمبراطورية يتم توزيع القيم بشكل موحد تقريبًا. نسب عالية من منخفضة جدا صإمبراطورية من المحتمل أن تكون القيم (الشكلان 3 و S2) ناتجة عن إشارة ارتباط حقيقية.

تم تخصيص الجينات لـ 50 حاوية وفقًا لـ pإمبراطورية. يوضح الرسم البياني عدد الجينات مع صإمبراطورية القيم (المحور الأيسر). يُظهر الخط الأحمر متوسط ​​عدد SNPs لكل جين لكل سلة (المحور الأيمن). على عكس إحصائيات الاختبار على مستوى الجين ، نلاحظ عدم وجود ارتباط بين عدد تعدد الأشكال لكل جين مع صإمبراطورية لأي طريقة. نلاحظ زيادة في الجينات منخفضة جدا صإمبراطورية القيم الناتجة عن إشارة الارتباط الفعلية.

غير منضبط مقابل القيمة الاحتمالية التجريبية

على الرغم من أن الطرق المختلفة تؤدي إلى مستويات مختلفة من الارتباط لجين معين ، إلا أن النتائج مترابطة. بين الطرق الثلاث لاشتقاق pإمبراطورية القيم ، نلاحظ متوسط ​​معامل ارتباط رتبة سبيرمان يبلغ 0.74 عند النظر في أفضل 500 جين (الجدولان S1 و S2). متوسط ​​معامل ارتباط رتبة سبيرمان بين الطرق الثلاث قبل اشتقاق pإمبراطورية القيم (أي التحكم في عدد المتغيرات لكل جين و LD) هي 0.30 فقط ، مما يعكس التحيزات المختلفة التي أدخلتها طرق اشتقاق إحصائيات الاختبار على مستوى الجين

ال صإمبراطورية يتم التحكم في القيم بالنسبة لعدد النيوكلوتايد لكل جين وبنية الارتباط ، ولكن كيف تؤثر السيطرة على الجينات الفردية؟ لمعالجة هذا السؤال ، نقوم بتحويل إحصائيات الاختبار المجمعة إلى قيم p بافتراض أن إحصائيات الاختبار لها χ1 2 التوزيع. يتم رسم قيم p غير المتحكم فيها مقابل صإمبراطورية قيم جميع الطرق الثلاث (الشكلان 4 و S3):

  • بالنسبة إلى maxT طريقة الجينات مع العديد من النيوكلوتايد (كبير ن) من المرجح أن يكون لديها إحصائية اختبار عالية وبالتالي قيمة p منخفضة غير متحكم فيها. عند الاشتقاق صإمبراطورية القيم التي نتحكم فيها ن. السيطرة لها تأثير ضئيل جدا على الجينات مع ن = 1 وفي هذه الحالة تكون قيم p التجريبية وغير المتحكم فيها متشابهة جدًا (تقع على طول القطر في الشكلين 4 و S3). للجينات ذات المستوى الأعلى ن السيطرة أقوى و صإمبراطورية القيم أعلى من قيم p غير المنضبط.
  • ل عنى نلاحظ توزيعًا يشبه السيني. هذا ما يفسره تأثير التباين ن: نحن نقارن معدل مع إحصائيات الاختبار المرصودة. إذا لم يكن هناك ارتباط ، فإن إحصاء الاختبار المتوقع هو 1. وبالتالي فإن قيم المتوسط ​​المتوقعة لمجموعات البيانات المخففة هي 1 ، أي بزيادة ن من المرجح أن يكون الوسط المتناوب هو 1. بالنسبة للجينات ذات الحجم الكبير ن هذا يؤدي إلى التطرف صإمبراطورية القيم عند مقارنتها بالمتوسط ​​المخفف T. نتيجة توزيع الجينات ذات الحجم الكبير ن يظهر انحناء أقوى من الجينات الصغيرة ن. عندما تكون قيمة المتوسط ​​الملحوظ هي 1 (قيمة p غير المنضبط = 0.317) فإن عنصر التحكم (في المتوسط) لا يتأثر بـ ن. لذلك فإن النقاط التي تمثل الجينات ذات اختلاف ن تداخل في المتوسط ​​T = 1.
  • توزيع أعلى مشابه لـ maxT ، لكن التدرج اللوني للجينات التي تحتوي على العديد من SNPs يكون أقل حدة.

لكل جين صإمبراطورية يتم رسمه مقابل القيمة p غير المنضبط (بناءً على إحصائية الاختبار على مستوى الجين). تمثل كل نقطة جينًا ويتم تلوينها وفقًا لعدد SNPs المخصصة للجين (ن). الجينات التي تحتوي على عدد قليل من SNPs لها صإمبراطورية قيم مشابهة للقيمة p غير المنضبط وبالتالي تتجمع على طول القطر. بالنسبة للجينات التي تحتوي على عدد أكبر من SNPs ، يعتمد التوزيع على طريقة دمج إحصائيات الاختبار.

أداء

لتقييم أداء الطرق المختلفة للجمع بين إحصائيات الاختبار ، قمنا برسم منحنيات خصائص تشغيل جهاز الاستقبال (ROC) للقرص المضغوط و T1D (الشكل 5) باستخدام مجموعتين من جينات المرض المؤكدة [17] ، [18] على افتراض أن جميع الجينات الأخرى غير مرتبطة (انظر الطرق). تعتمد جينات المرض المعروفة على التحليل التلوي CD [17] و T1D [18]. استنادًا إلى المواقع الجينية التي نجحت في تكرار اختيار المؤلفين للجين المرشح الأكثر ترجيحًا مع الأخذ في الاعتبار المشاركة المعروفة في الجهاز المناعي ، والارتباط مع اضطرابات المناعة الذاتية الأخرى وموقع أكثر تداخلات النيوكلوتايد ارتباطا. على الرغم من أن قائمة الجينات الناتجة قد تحتوي على جينات غير مرتبطة بالسمة ، إلا أنها أفضل مجموعة بيانات متاحة حاليًا لتقييم أداء طرقنا لقياس الارتباط الجيني على مستوى الجينات.

لتقييم أداء الطرق المختلفة لدمج إحصائيات الاختبار ، قمنا برسم نسبة جينات المرض المؤكدة (المعدل الإيجابي الحقيقي) مقابل ترتيبها ضمن مجموعة الجينات الكاملة (المعدل الإيجابي الكاذب).

الثلاثة جميعا صإمبراطورية تعطي الأساليب نتائج أفضل بكثير مما كان متوقعا عن طريق الصدفة. بالنسبة لكلا المرضين ، تؤدي طريقة topQ أداءً أفضل قليلاً من maxT والمتوسط ​​T ، على الرغم من أن جميع الطرق الثلاثة تعمل بشكل مشابه مع وجود اختلافات في المناطق الواقعة تحت المنحنى (AUC) أقل من 2٪. قد يعتمد أداء الطرق المختلفة للمرضين على عدد SNPs المخصصة لجينات المرض المعروفة. بالنسبة للجينات التي تحتوي على العديد من تعدد الأشكال ، يمكن أن تضعف إشارة الارتباط ، كما هو الحال بالنسبة لجين مرض القرص المضغوط ZNF365، الذي يحتوي على 91 SNPs (الجدول 2). الحد الأقصى لها هو 23.74 وهو ما يتوافق مع صإمبراطورية = 0.0001 ، لكن المتوسط ​​T و topQ لهذا الجين هو 2.46 (صإمبراطورية = 0.0041) و 8.32 (صإمبراطورية = 0.0010) ، على التوالي. وبالتالي ، فإن الأداء الذي يتم قياسه هنا بواسطة AUCs يعتمد على خصائص جينات المرض المعروفة ولا يمكننا إلا أن نفترض أنها مميزة لجينات المرض التي لم يتم تحديدها بعد.

تم تصنيف العديد من جينات المرض المعروفة باستمرار منخفضة جدًا من خلال جميع الطرق الثلاثة (الجدول 2). بالنسبة لبعض هذه الجينات ، تزيد SNPs المرتبطة بها عن 40 كيلو بايت من الجين (على سبيل المثال PTPN22) ، أو يوجد SNP المرتبط في الجين المجاور (على سبيل المثال ORMDL3). تم تصنيف جينات الأمراض المؤكدة الأخرى في مرتبة منخفضة لأن SNP المرتبط بها لم يتم تنميطه وراثيًا بواسطة WTCCC (على سبيل المثال JAK2) أو لم يظهر أي ارتباط (على سبيل المثال PLCL1).

الربط اختلال التوازن

يتأثر تحليلنا باختلال التوازن (LD) وبعض الجينات ذات التصنيف الأعلى (الجدول 3) هي جزء من نفس منطقة LD ، مما يعكس حقيقة أن إشارة الارتباط الحقيقية يمكن أن تمتد عبر منطقة كبيرة من الجينوم إذا وقعت في كتلة LD كبيرة. يبدو أن معظم تعدد الأشكال في مثل هذه المنطقة مرتبطة بالنمط الظاهري الذي يمكن أن ينتج عنه عدة جينات ذات قيم p تجريبية كبيرة. على سبيل المثال، CYLD و SNX20 لديك صإمبراطورية القيم الأصغر من 5.4 × 10 5 تقع في المنبع والمصب NOD2 وتقع في نفس كتلة LD مثل NOD2. من المحتمل أن يكون ارتباطهم ناتجًا عن الارتباط المؤكد لـ NOD2 الجين [26] ، [27] ، [28]. لمزيد من تقييم تأثير صعوبة التعلم على تحليلاتنا ، قمنا بتمديد الجين الأولي لتعيين SNP. بالإضافة إلى SNPs الموجودة داخل الجين أو نافذة جانبية 40 كيلو بايت ، نقوم بتضمين SNPs في LD (r 2 & gt0.8) مع أي SNP في هذه المنطقة. يؤدي هذا إلى زيادة متوسط ​​عدد SNPs لكل جين إلى 15.5 (من 13.9) وإجمالي عدد SNPs المخصص للجينات إلى أكثر من 296000 (من 290.000) (الشكل S4). إن تضمين LD في الجين لتخصيص SNP له تأثير معتدل فقط: على الرغم من أن قيم AUC تظهر زيادة طفيفة لكل طريقة (& lt1.3٪) ، إلا أن أقلية صغيرة فقط من الجينات تتأثر (الشكل S5). الرتب الجينية التي تم الحصول عليها مع وبدون مراعاة LD ترتبط ارتباطًا وثيقًا (ارتباط رتبة سبيرمان r = 0.98 لكل طريقة ومرض). فقط 3 جينات من أعلى 100 لديها مرتبة أعلى من 100 عند تضمين LD (maxT للقرص المضغوط) وجميع الجينات التي تمت مناقشتها هنا والموضحة في الجداول فقط تغير ترتيبها أو قيمتها p بشكل هامشي.

التقسيم الطبقي للسكان

تتمثل طريقة التحليل الأساسية لدينا في اختبار الارتباط باختبار Cochran Armitage Trend Test ، مع تصحيح التحكم الجينومي لأسلاف السكان ، لأن هذا يجعل إجراء عدد كبير من التباديل قابلاً للحساب. لتقييم تأثير التقسيم الطبقي للسكان على تحليلنا بمزيد من التفصيل ، أجرينا تحليل المكون الرئيسي [21] لمجموعتي البيانات. كررنا اختبار الارتباط باستخدام الانحدار اللوجستي والضبط لأول مكونين رئيسيين (تصحيح الكمبيوتر الشخصي). أدى هذا إلى تقليل مقياس التحكم الجيني للقرص المضغوط من λ = 1.12 إلى = 1.08 ، مع عدم وجود انخفاض ملحوظ لـ T1D (λ = 1.06). لم يؤدي الضبط لما يصل إلى 10 أجهزة كمبيوتر إلى تقليل λ أكثر من ذلك. كانت العلاقة بين الرتب الجينية لتحليلنا الأساسي وبعد تصحيح التقسيم الطبقي للسكان عالية (CD-maxT R = 0.932 ، CD-meanT R = 0.942 ، CD-topQ R = 0.940 ، T1D-maxT R = 0.997 ، T1D-meanT R = 0.998 ، T1D-topQ R = 0.998). تتأثر الرتب الجينية للقرص المضغوط أكثر من T1D: من بين أفضل 100 جينة في تحليلنا الأساسي ، يوجد 78 جينة ضمن أفضل 100 جينة بعد تصحيح الكمبيوتر الشخصي ، وجميع الجينات المائة ضمن أفضل 204 جينات (maxT ، الشكل S6). بالنسبة إلى T1D ، يوجد 86 من أصل 100 جينة في تحليلنا الأساسي ضمن أفضل 100 جينة بعد تصحيح الكمبيوتر الشخصي وجميع الجينات المائة ضمن أعلى 143 جينة (maxT ، الشكل S6). يؤثر تصحيح مكونين رئيسيين بشكل هامشي فقط على أداء طرقنا: زادت قيم AUC بنسبة & lt0.6٪ لكل من CD و T1D.

الجينات المرتبطة

جميع الجينات التي تمت مناقشتها هنا فقط تغير بشكل هامشي رتبتها أو قيمتها p بعد تصحيح مكونين رئيسيين أو عند التفكير في LD لـ SNP لتخصيص الجينات. بالنسبة للقرص المضغوط ، نجد 7 من أصل 39 جينة مرضية معروفة (إيجابيات حقيقية) ضمن أفضل 30 جينًا عندما نصنف جميع الجينات بناءً على صإمبراطورية القيم (مشتقة من maxT). نحن نستخدم إحصائيات الاختبار الخاصة بهم على مستوى الجينات لحل العلاقات متى صإمبراطورية القيم متطابقة لجينين أو أكثر (الجدول 3). الجينات STAT3 (الحد الأقصى رتبة 27) و SBNO2 (رتبة الحد الأقصى 26) تقع ضمن مواضع المرض المعروفة ، ولكنها ليست جزءًا من القائمة الإيجابية الحقيقية لأن إشارة الارتباط تمتد عبر عدة جينات [17]. لم يصل كلا الموقعين إلى أهمية على مستوى الجينوم في دراسة WTCCC الأصلية وتم تأكيد ارتباطهما فقط في تحليلات تلوية حديثة واسعة النطاق. STAT3 و SBNO2 يمكن ربطها بـ IL10 / STAT3 المسار المضاد للالتهابات [29] ، والذي يرتبط بالقرص المضغوط [2] ، [17] ، [30].

قد يكون المرشح الواعد الآخر لمؤتمر نزع السلاح DAG1 (dystroglycan 1) ، في المرتبة 23 لـ maxT. يقع داخل كتلة LD كبيرة تم تكرار ارتباطها والتي تشمل حوالي 35 جينًا [17]. DAG1 هو مستقبل سطح الخلية الذي يستخدمه العديد من مسببات الأمراض المعروفة [31] ، [32] وهناك تكهنات حول دور DAG1 في امتصاص المتفطرة الطيرية ssp. نظير السل ومسببات مرض كرون [33].

بالنسبة إلى T1D ، يوجد خمسة من أصل 27 جينًا معروفًا للمرض ضمن أعلى 30 جينًا (بناءً على maxT ، والجداول S3 و S4). من بين أفضل 30 جينًا ، يقع 14 جينًا في منطقة LD كبيرة على الكروموسوم 12 (الموضع 111348628 ليضع 112.947.717) ، والذي يحتوي على 15 جينًا. بحسب تود وآخرون. [34] الجين السببي الأكثر احتمالا لهذه المنطقة هو SH2B3. اكتشف المؤلفون وجود SNP غير مترادف شديد الارتباط في exon 3 من SH2B3 ، التي لم يتم تنميطها وراثيًا في دراسة WTCCC [16]. تم تعيين اثنين من SNPs التي تم التنميط الجيني في WTCCC إلى SH2B3 وتظهر ارتباطًا معتدلًا (ع = 3 × 10 −5 و ص = 7 × 10 −4). نظرًا لأن 40 من SNPs الأخرى في المنطقة تظهر ارتباطًا أقوى ، SH2B3 في المرتبة 26 فقط (من خلال maxT).


أساليب

استرجاع البيانات ومعالجتها

تم تنزيل الإصدار الأخير (المرحلة 1 ، الإصدار 3 ، أكتوبر 2012) من 1000 ملف Genomes vcf تحتوي على أنماط وراثية مرحلية لـ 36.7 مليون من تعدد الأشكال الوراثي و 1.38 مليون SSV جسمي من 1000 خادم ftp لمشروع جينوم [92]. تم أيضًا تنزيل معلومات أليل الأسلاف لـ SNPs على أساس محاذاة الأنواع المتعددة ، لجميع المتغيرات من موقع 1000 Genomes ftp. تم إجراء تحويل بيانات 1000 جينوم إلى تنسيق PLINK باستخدام أدوات VCF [93 ، 94]. تم إجراء حسابات التردد والعديد من عمليات معالجة البيانات الأخرى باستخدام PLINK [94]. تم استبعاد المجموعات المختلطة (ASW و CLM و MXL و PUR) وتم دمج السكان الصينيين (CHB و CHS) في مجموعة واحدة باستخدام PLINK والتي نشير إليها باسم "الصين". تم تصنيف SNPs على أنها شائعة في مجموعة سكانية إذا لوحظ أن MAF أكبر من 0.05 في تلك المجموعة السكانية. تم التعامل مع SNPs مع MAF أقل على أنها نادرة.

التوزيع الجينومي وتحليل التخصيب الإقليمي

تم إجراء تحديد تخصيب CPS SNPs في المناطق الجينية باستخدام نصوص Perl مخصصة. استخدمنا نهجين على أساس النافذة المنزلقة. في النهج الأول ، تم فحص كل كروموسوم باستخدام نوافذ انزلاقية وغير متداخلة 50-SNP وتم حساب تكرار CPS SNPs في كل نافذة. بناءً على التواجد الكلي لـ CPS SNPs في الكروموسوم بأكمله ، فإن فرط الهندسة التراكمي ص- تم تقدير قيمة تخصيب CPS SNPs في كل نافذة. لتصحيح اختبار الفرضيات المتعددة ، استخدمنا أسلوبًا متحفظًا ص-قيمة قطع & lt5 × 10 -8 لتحديد النوافذ المخصبة بـ CPS SNPs. في الطريقة الثانية ، استخدمنا فحصًا مشابهًا باستخدام نوافذ غير متداخلة تبلغ 5 كيلوبايت.

فحص التحديد

تم تقييم تواقيع الاختيار باستخدام طريقتين مختلفتين. تم حساب درجة iHS القائمة على النمط الفرداني المتماثل الزيجوت باستخدام حزمة WHAMM [95]. نظرًا لأن حساب iHS يتطلب تحديد المواقع المادية ، فقد قمنا بتنزيل الخريطة المادية للربط المدمجة لبناء الجينوم البشري GrCh37 من خريطة روتجرز [96] ودمجنا المواضع المادية في البيانات الحالية. لكل مجموعة سكانية ، تم حساب درجات iHS لـ SNPs التي تحدث في إطارات 50-SNP والتي تم إثرائها في CPS SNPs في تلك المجموعة باستخدام البرنامج النصي iHS_calc من حزمة WHAMM. لتقدير توزيع iHS في الخلفية لكل مجموعة سكانية ، قمنا بأخذ عينات عشوائية من 10000 كتلة 50-SNP وحساب درجات iHS لـ SNPs التي تحدث في هذه الكتل. بناءً على حاويات تردد الأليل المشتقة من الخلفية ، تم بعد ذلك توحيد درجات iHS. كامتداد لدرجات iHS ، حددنا أيضًا درجات تخصيب iHS (iES) وهي نسبة SNPs في كل نافذة 50-SNP بها | iHS | & gt 2. تم اختيار النوافذ التي تظهر أعلى 1٪ و 5٪ و 10٪ من درجات iES على التوالي كثلاثة مستويات للتحليل. لكل مستوى ، تم تقدير توزيع iES المتوقع في جميع نوافذ CPS SNP للسكان ومقارنته بالتوزيع الفعلي. تم تقدير الأهمية الإحصائية للتمثيل المفرط لدرجات iES في النوافذ المخصبة بـ CPS SNP من السكان باستخدام ص-قيمة محسوبة من خلال تحليل إعادة أخذ عينات تمهيد التشغيل. تم إجراء تحليل مماثل أيضًا لنوافذ 5 كيلو بايت المخصب بـ CPS SNP في كل مجموعة. بالإضافة إلى ذلك ، تم إجراء مجموعة منفصلة من التحليلات لكل من النوافذ 50-SNP و 5 كيلو بايت ، مع مراعاة تعدد الأشكال فقط مع الحد الأدنى من MAF من 0.05.

تم حساب دعم السلوك الإيجابي باتباع الطرق التي اقترحها يي وزملاؤه [71]. لحساب درجات PBS للسكان الأفارقة (YRI و LWK) ، تم استخدام JPT كمنشز. بالنسبة للسكان الآسيويين الصينيين و JPT ، تم استخدام YRI كمنطقة خارجية. وبالمثل بالنسبة للسكان الأوروبيين (FIN و IBS) ، تم استخدام YRI على أنه الخارج. لكل ثلاث مجموعات سكانية (مثل YRI-LWK-JPT أو JPT-CHB-YRI) قدرنا توزيع الخلفية لدرجات PBS ، باستخدام 10000 ، تم اختيارها عشوائيًا بنوافذ 50-SNP. حددنا بعد ذلك حدودًا نهائية للنتائج بناءً على أعلى 1٪ و 5٪ و 10٪ من توزيع الخلفية وقدرنا عدد نوافذ 50-SNP و 5 kb والتي يمكن توقع أن تكون في أعلى 1٪ ، 5٪ و 10٪ نطاق نقاط PBS للسكان. تمت مقارنة عدد النوافذ المرصودة في النطاق 1٪ و 5٪ و 10٪ بالعدد المتوقع والمماثل ص- تم تقدير القيم باستخدام تحليل التمهيد.

معدل إعادة التركيب

استرجعنا خريطة إعادة التركيب deCODE وخرائط إعادة التركيب ذات الصلة HapMap (hapMapRelease24YRIRecombMap و hapMapRelease24CombinedRecombMap) باستخدام مستعرض جدول UCSC [97]. وجد توزيع النقاط الساخنة لإعادة التركيب من خريطة إعادة التركيب deCODE باستخدام قطع SRR (معدل إعادة التركيب المعياري للجنس) من 10 نقاطًا قليلة فقط في مجموعة الجينات ولم يتم تحليلها بشكل أكبر.

تم استخدام خريطة إعادة التركيب HapMap YRI (hapMapRelease24YRIRecombMap) لتحديد النقاط الساخنة لإعادة التركيب والبقع الباردة في YRI ومجموعة البيانات المدمجة. تمت دراسة توزيع معدلات إعادة التركيب لتحديد مناطق الجينوم التي تظهر أعلى درجات معدل إعادة التركيب 1٪ وتم تصنيف هذه المناطق كنقاط ساخنة لإعادة التركيب. استخدمنا أيضًا أعلى درجات معدل إعادة التركيب 5٪ لتحديد مجموعة ثانية من النقاط الفعالة. وبالمثل ، تم تحديد مجموعتي البقع الباردة بالمثل بأقل معدلات إعادة التركيب 1٪ و 5٪. استنادًا إلى التوزيع الجيني لمعدلات إعادة التركيب في YRI (hapMapRelease24YRIRecombMap) ، قدرنا عدد مواقع النقاط الساخنة المتوقع حدوثها في النوافذ المخصبة بـ CPS SNP لـ YRI. تمت مقارنة القيمة المتوقعة بالقيمة المرصودة وفرط هندسي تراكمي ص- تم استخدام القيمة لتقدير الأهمية الإحصائية للتمثيل الزائد أو الناقص للنقاط الساخنة لإعادة التركيب والبقع الباردة في نوافذ 50-SNP المخصبة بـ CPS و CPS SNP المخصب 5 كيلو بايت النوافذ في YRI. تم إجراء تحليلات مماثلة لجميع المجموعات السكانية الأخرى ، بشكل فردي وكذلك مجتمعة ، باستخدام خريطة إعادة التركيب المدمجة HapMap (hapMapRelease24CombinedRecombMap).

تقييم وظيفة SNP

تم تحديد السياقات الجينومية لجميع النيوكلوتايد SNPs باستخدام ANNOVAR ، والذي تم استخدامه أيضًا لتوضيح المتغيرات غير المترادفة التي يحتمل أن تكون وظيفية بناءً على تأثيرها الوظيفي المتوقع على مستوى البروتين. تستمد ANNOVAR درجات التأثير الوظيفي المحسوبة مسبقًا لـ SIFT [80] ، POLYPHEN2 [79], LRT [82] ومتذوق الطفرة [81]. تم اعتبار المتغيرات غير المترادفة ذات تأثير وظيفي إذا تم استيفاء معايير النتيجة الموصى بها لأي من الخوارزميات ، SIFT: ≥ 0.95 ، POLYPHEN2: ≥ 0.85 ، LRT ≥ 0.5 ، Mutation Taster 0.50.

من أجل تحديد CPS SNPs غير المشفرة التي قد يكون لها تأثير على ارتباط العوامل التنظيمية ، تم البحث في المتغيرات intronic وتلك الجينات المرافقة مقابل قاعدة بيانات RegulomeDB [83] ، والتي تستخدم نظام تسجيل إرشادي يعتمد على الثقة في أن المتغير يكمن في عنصر تنظيمي وما إذا كان له عواقب وظيفية معروفة أو محتملة مثل تغيير ارتباط عامل النسخ (TF) والتغييرات في أنماط التعبير للجين (الجينات) المرتبطة. يتم تصنيف متغيرات dbSNP [99] إلى 6 فئات ، حيث تتمتع الفئة 1 بأعلى مستوى من الثقة بسبب بيانات eQTL المرتبطة ، والفئة 6 هي الأدنى. فقط CPS SNPs التي تنتمي إلى الفئتين 1 و 2 تم اعتبارها معدلة للتنظيم ، لأنها الأكثر احتمالاً أن تؤدي إلى نتيجة وظيفية.

تحليل IPA

لكل مجموعة سكانية ، تم إنشاء قائمتين للجينات من مجموعة CPS SNP. الأول احتوى فقط على الجينات التي تضمنت متغيرات مختارة ، تم تحديدها بواسطة معرفات rs [99]. احتوى الثاني على جميع الجينات التي احتوت على تعدد الأشكال المحددة ، وكذلك الجينات المجاورة الأقرب لـ SNPs التي كانت متداخلة بين الجينات. By definition, the second list contained more genes than the first. Ingenuity Pathway Analysis (IPA) software was used to analyse gene interaction networks in the gene lists, as well as enriched ‘canonical’ pathways describing well characterised and validated regulatory pathways [84].

DAVID analysis

The Database for Annotation, Visualisation and Integrated Discovery (DAVID) [85] is an online tool that accepts a list of genes as input and performs functional analysis on them. It provides a list of functions enriched in the gene list, and clusters these functions according to their similarity. Functions include gene ontology (GO) and Swiss-Prot annotation, InterPro matches, OMIM [100] and other disease links, as well as KEGG [101, 102] and other pathway database links. The gene-enrichment analysis is based on the Fisher’s Exact test, which determines whether or not a given list of genes is enriched for a certain function label or if this function occurs in the list by chance. أ ص-value shows the significance and adjusted ص-values are also provided, after correction for multiple testing. The gene lists for each population that contained CPS SNPs were run through DAVID to identify overrepresented pathways and other functional labels.

Function and disease association of CPS-SNP containing genes

Potential functions of CPS-SNP containing genes and their role in various diseases were inferred from the GeneCards database [103].


Genes, Behavior, and the Social Environment: Moving Beyond the Nature/Nurture Debate.

In the search for a better understanding of genetic and environmental interactions as determinants of health, certain fundamental aspects of human identity pose both a challenge and an opportunity for clarification. Sex/gender and race/ethnicity are complex traits that are particularly useful and important because each includes the social dimensions necessary for understanding its impact on health and each has genetic underpinnings, to varying degrees.

Although there have been numerous genetic studies of sex and gender𠅊nd more recently race and ethnicity—over the past several decades, detailed information about the extent of our genetic similarities and differences did not reach the public’s attention until the completion of the Human Genome Project. With base pair comparisons possible across the individuals sequenced, the estimate that any two humans are 99.9 percent the same has raised our awareness that all humans are incredibly similar at the genetic level. Paradoxically, the evidence of vast numbers of DNA base pairs at which humans differ also became known at this time. It is estimated currently that any two people will differ at approximately 3 million positions along their genomes. Although there is some evidence that information about an individual’s sex or ancestry would provide information about the likelihood that he/she carries one allele versus another, it is typically a matter of probability—not a discrete or absolute determinant (even for the Y chromosome). While there is growing evidence of a number of significant differences between males and females in terms of health and health outcomes (IOM, 2001), 𠇌onsiderable controversy remains about the existence and importance of racial differences in genetic effects, particularly for complex diseases” (Ioannidis et al., 2004).

Previous chapters have discussed the contributions of the social environment, behavior, psychological factors, physiological mechanisms, and genetic variation to health. This chapter highlights the fact that the contributions of these variables are not monolithic and that fundamental individual traits, such as sex/gender and race/ethnicity, can change their meaning and health impact in different contexts. These complex traits are multifaceted, and the goal is to tease apart the facets at different levels of organization in order to identify which of them directly modulate health. This is a reciprocal process, because these various domains in turn inform our understanding of sex/gender and race/ethnicity. Failing to distinguish these different facets, both in the aggregate and within each level of analysis, will compromise the ability to obtain a more fine-grained understanding of how the different aspects of these fundamental individual traits interact to influence health.


خيارات الوصول

احصل على الوصول الكامل إلى دفتر اليومية لمدة عام واحد

جميع الأسعار أسعار صافي.
سيتم إضافة ضريبة القيمة المضافة في وقت لاحق عند الخروج.
سيتم الانتهاء من حساب الضريبة أثناء الخروج.

احصل على وصول محدود أو كامل للمقالات على ReadCube.

جميع الأسعار أسعار صافي.


تعليق

From a biological point of view, genetic research over the past decade has led to an unprecedented level of raw information about schizophrenia risk, as have genomic investigations of other traits and complex diseases across medicine, including in cancer, hypertension, diabetes mellitus, and cardiovascular disease. But how far will genetic insights take psychiatry? Will they change how patients are clinically diagnosed? Will they predict outcome and personalize medicine? Will they lead to novel therapies based on pathogenesis? My view is that the latter is a good bet, and the others are much more speculative. Given the substantial role of environmental variables in the etiology and course of all complex disorders, it is unlikely that even sequencing the DNA of everyone on the planet would lead to a full understanding of schizophrenia. It is important to continually emphasize that genes do not encode for psychopathology. Genes associated with schizophrenia implicate subtle malfunctions at the molecular and cellular level, most likely within neurons, altering micro- and macrocircuits in the developing brain. Cells process molecular information, and circuits process environmental information (e.g., sensory information, cognitive information, social information). Behavior is an emergent phenomenon of circuit physiology, which may be aberrant because the cells comprising the circuit are altered, for example, by not signaling to each other in an appropriate manner for a given context, based on the genetic and epigenetic programs that entrain their development and function. Psychiatric disorders ultimately reflect how the brain mishandles environmental information, which at the systems level is far “downstream” of the effect of genes in cells. Thus, given the complexity of the development and function of the brain and its emergent properties, determining what it means for a brain to be at increased risk for schizophrenia is a far more complex and challenging problem than finding susceptibility loci.

There is also reason to wonder to what degree GWAS associations sharpen the focus on the core pathogenic processes of schizophrenia. The omnigenic hypothesis mentioned above cautions that many GWAS associations are likely to be relatively peripheral factors in causation, detected because they play a role in the biological function of relevant cells. This may account in part for the substantial overlap between schizophrenia and not just other psychiatric diagnoses but even disorders as seemingly distant pathogenically as amyotrophic lateral sclerosis (46). Moreover, while the loci that have been found seem not to respect our clinical diagnoses, the drugs we use to treat patients generally do. Lithium is not antipsychotic clozapine does not benefit individuals with ADHD and stimulants are not antimanic drugs. From a clinical perspective, treatment is a litmus test of biological relevance.

There is also concern that some of the genes within GWAS loci may not substantially contribute to symptomatology in adulthood. Studies of gene expression in adult postmortem brain samples of patients with schizophrenia do not generally find differential expression of genes within GWAS loci (47, 48). In contrast, in a consistent emergent literature, many of the genes found in these loci have been found to be preferentially expressed and dynamically regulated in fetal life (49), consistent with the prevailing assumption that schizophrenia, like most psychiatric syndromes, has early developmental origins (50). A recent study (45) found that a substantial fraction of genes in the GWAS-significant loci are abundantly expressed in the placenta and are dynamically regulated in placenta from complicated pregnancies, possibly explaining the link between schizophrenia risk and pregnancy complications. While this finding has potential implications for primary prevention based on enhancing placental health, it does not suggest specific treatment options for an affected adult.

These caveats notwithstanding, genes are critical and valid entry points to the biology of cells, and genes related to risk for schizophrenia are building blocks for model systems that may lead to novel insights and novel therapeutic targets. There is considerable enthusiasm in basic research laboratories for creating neuronal models based on human pluripotent stem cells from patients with schizophrenia and from cells with genomes that contain risk-associated variants (51). In principle, such approaches may identify early developmental phenotypes that can be rescued experimentally. While this work also may not translate simply to the adult brain, it is worth remembering that the molecular programs that build synapses are at least in part the same ones that sustain them and modify them during adult life. Furthermore, animal research has shown that some early developmental abnormalities, even in brain structure, may be reversed during adulthood (52). This is a new frontier, but it is not science fiction.

For good reason, 21st-century medicine has become highly intertwined with genomic-based medicine. Psychiatry is part of this new age, and the opportunities to change our nosology and our understanding of what we call mental illness and to find new approaches to improve the lives of affected individuals have never seemed more promising. That being said, as usual, the more we learn, the more we need to know, and with such a complex task, it’s likely to be a bumpy ride.


محتويات

An organism's genotype may not define its haplotype uniquely. For example, consider a diploid organism and two bi-allelic loci (such as SNPs) on the same chromosome. Assume the first locus has alleles أ أو تي and the second locus جي أو ج. Both loci, then, have three possible genotypes: (AA, AT، و TT) و (GG, GC، و نسخة)، على التوالى. For a given individual, there are nine possible configurations (haplotypes) at these two loci (shown in the Punnett square below). For individuals who are homozygous at one or both loci, the haplotypes are unambiguous - meaning that there is not any differentiation of haplotype T1T2 vs haplotype T2T1 where T1 and T2 are labeled to show that they are the same locus, but labeled as such to show it doesn't matter which order you consider them in, the end result is two T loci. For individuals heterozygous at both loci, the gametic phase is ambiguous - in these cases, you don't know which haplotype you have, e.g., TA vs AT.

AA AT TT
GG AG AG AG TG TG TG
GC AG AC AG TC
أو
AC TG
TG TC
نسخة AC AC AC TC TC TC

The only unequivocal method of resolving phase ambiguity is by sequencing. However, it is possible to estimate the probability of a particular haplotype when phase is ambiguous using a sample of individuals.

Given the genotypes for a number of individuals, the haplotypes can be inferred by haplotype resolution or haplotype phasing techniques. These methods work by applying the observation that certain haplotypes are common in certain genomic regions. Therefore, given a set of possible haplotype resolutions, these methods choose those that use fewer different haplotypes overall. The specifics of these methods vary - some are based on combinatorial approaches (e.g., parsimony), whereas others use likelihood functions based on different models and assumptions such as the Hardy–Weinberg principle, the coalescent theory model, or perfect phylogeny. The parameters in these models are then estimated using algorithms such as the expectation-maximization algorithm (EM), Markov chain Monte Carlo (MCMC), or hidden Markov models (HMM).

Microfluidic whole genome haplotyping is a technique for the physical separation of individual chromosomes from a metaphase cell followed by direct resolution of the haplotype for each allele.

Unlike other chromosomes, Y chromosomes generally do not come in pairs. Every human male (excepting those with XYY syndrome) has only one copy of that chromosome. This means that there is not any chance variation of which copy is inherited, and also (for most of the chromosome) not any shuffling between copies by recombination so, unlike autosomal haplotypes, there is effectively not any randomisation of the Y-chromosome haplotype between generations. A human male should largely share the same Y chromosome as his father, give or take a few mutations thus Y chromosomes tend to pass largely intact from father to son, with a small but accumulating number of mutations that can serve to differentiate male lineages. In particular, the Y-DNA represented as the numbered results of a Y-DNA genealogical DNA test should match, except for mutations.

UEP results (SNP results) Edit

Unique-event polymorphisms (UEPs) such as SNPs represent haplogroups. STRs represent haplotypes. The results that comprise the full Y-DNA haplotype from the Y chromosome DNA test can be divided into two parts: the results for UEPs, sometimes loosely called the SNP results as most UEPs are single-nucleotide polymorphisms, and the results for microsatellite short tandem repeat sequences (Y-STRs).

The UEP results represent the inheritance of events it is believed can be assumed to have happened only once in all human history. These can be used to identify the individual's Y-DNA haplogroup, his place in the "family tree" of the whole of humanity. Different Y-DNA haplogroups identify genetic populations that are often distinctly associated with particular geographic regions their appearance in more recent populations located in different regions represents the migrations tens of thousands of years ago of the direct patrilineal ancestors of current individuals.

Y-STR haplotypes Edit

Genetic results also include the Y-STR haplotype, the set of results from the Y-STR markers tested.

Unlike the UEPs, the Y-STRs mutate much more easily, which allows them to be used to distinguish recent genealogy. But it also means that, rather than the population of descendants of a genetic event all sharing the نفس result, the Y-STR haplotypes are likely to have spread apart, to form a العنقودية of more or less similar results. Typically, this cluster will have a definite most probable center, the modal haplotype (presumably similar to the haplotype of the original founding event), and also a haplotype diversity — the degree to which it has become spread out. The further in the past the defining event occurred, and the more that subsequent population growth occurred early, the greater the haplotype diversity will be for a particular number of descendants. However, if the haplotype diversity is smaller for a particular number of descendants, this may indicate a more recent common ancestor, or a recent population expansion.

It is important to note that, unlike for UEPs, two individuals with a similar Y-STR haplotype may not necessarily share a similar ancestry. Y-STR events are not unique. Instead, the clusters of Y-STR haplotype results inherited from different events and different histories tend to overlap.

In most cases, it is a long time since the haplogroups' defining events, so typically the cluster of Y-STR haplotype results associated with descendants of that event has become rather broad. These results will tend to significantly overlap the (similarly broad) clusters of Y-STR haplotypes associated with other haplogroups. This makes it impossible for researchers to predict with absolute certainty to which Y-DNA haplogroup a Y-STR haplotype would point. If the UEPs are not tested, the Y-STRs may be used only to predict probabilities for haplogroup ancestry, but not certainties.

A similar scenario exists in trying to evaluate whether shared surnames indicate shared genetic ancestry. A cluster of similar Y-STR haplotypes may indicate a shared common ancestor, with an identifiable modal haplotype, but only if the cluster is sufficiently distinct from what may have happened by chance from different individuals who historically adopted the same name independently. Many names were adopted from common occupations, for instance, or were associated with habitation of particular sites. More extensive haplotype typing is needed to establish genetic genealogy. Commercial DNA-testing companies now offer their customers testing of more numerous sets of markers to improve definition of their genetic ancestry. The number of sets of markers tested has increased from 12 during the early years to 111 more recently.

Establishing plausible relatedness between different surnames data-mined from a database is significantly more difficult. The researcher must establish that the very nearest member of the population in question, chosen purposely from the population for that reason, would be unlikely to match by accident. This is more than establishing that a randomly selected member of the population is unlikely to have such a close match by accident. Because of the difficulty, establishing relatedness between different surnames as in such a scenario is likely to be impossible, except in special cases where there is specific information to drastically limit the size of the population of candidates under consideration.


شاهد الفيديو: هل البدن و البقر تجزئ عن 7 أضاحي موصى بها (شهر نوفمبر 2022).