ACMG методология
Тази страница описва как Helena обработва, анотира и класифицира генетични варианти. Всички прагове, версии на референтните бази и правила за класификация, които работят в реална клинична практика, са документирани на тази страница. Страницата е предназначена за клинични генетици, ръководители на лаборатории и одитори по акредитация.
Класификацията на варианти е по методологията ACMG/AMP 2015 (Richards et al., Genetics in Medicine, 2015) чрез Байесовата точкова система на (Tavtigian et al., Hum Mutat. 2018;39(11):1485-1492. PMID: 30311386) с калибрирани BayesDel прагове от ClinGen SVI (Pejaver et al., Am J Hum Genet. 2022;109(12):2163-2177. PMID: 36413997) и SpliceAI интеграция по препоръките на ClinGen SVI 2023 (Walker et al., Am J Hum Genet. 2023;110(7):1046-1067. PMID: 37352859). За около 50–60 гена могат да се приложат и ген-специфични спецификации от ClinGen VCEP. Класификацията се основава изцяло на доказателства - никакъв модел за машинно обучение не определя патогенността. От версия v3.24 до v3.28 са въведени допълнителни предпазни механизми, които не допускат класификация „Вероятно патогенен“, когато доказателствата са само изчислителни или биологично несъвместими с механизма на гена (рецесивни гени със загуба на функция, двоен механизъм, толерантност към загуба на функция в gnomAD, отрицателни данни от ClinGen).
Съдържание
Преглед на процеса
От суров VCF файл до напълно класифицирани варианти в шест стъпки. Цял геном (~4 млн. варианта) се обработва за под 15 минути на специализиран хардуер.
Разчитане на VCF
~60sVCF файлът се зарежда в паметта за обработка. Мултиалелните позиции се обработват коректно. Изисква се референтен геном GRCh38.
Филтриране по качество
~5sПраговете за качество, дълбочина и качество на генотипа могат да се настройват. Варианти с известно клинично значение в ClinVar не се отхвърлят.
Анотация с VEP
~3-4 minEnsembl VEP определя функционалните последици, въздействието, транскрипта и белтъчната анотация за всеки вариант. Обработката е паралелна по хромозоми.
Анотация от референтни бази
~5-10sДанни от 16 референтни бази: популационни честоти, клинично значение, функционални предсказания, генна нетолерантност, фенотипни асоциации и чувствителност към дозата.
ACMG класификация
<1sКласификация по ACMG/AMP 2015 чрез Байесовата точкова система (Tavtigian et al. 2018). За всеки вариант се оценяват 19 автоматизирани критерия с калибрирана сила на доказателствата и се изчислява стойност на увереност. За около 50–60 гена могат да се приложат и ген-специфични VCEP спецификации. Хомозиготни референтни генотипове (hom_ref) от мултиалелни позиции не участват в класификацията.
Експорт
~5sОбобщенията по ген се подготвят за бързо зареждане в интерфейса. Класифицираните варианти се записват в аналитичната база за последващите модули.
Подход за максимална чувствителност
Helena класифицира всеки вариант, преминал филтъра за качество - без допълнително отсяване по честота или предсказано въздействие. Дори чест вариант (например с 40% честота в gnomAD) получава класификация: BA1 ще го определи като „Доброкачествен“, но няма да бъде премахнат преди класификацията. Така нито един вариант не остава невидим за генетика. Крайната преценка за клиничната значимост е негова, на база пълните данни от класификацията и анотацията.
Референтни бази
Всички референтни данни се съхраняват локално на инфраструктура в ЕС и никога не се изпращат към външни услуги. Версиите на базите са фиксирани и документирани по-долу.
gnomAD
Популационни честоти на алелите (глобални и за конкретни популации), брой алели, брой хомозиготи
Използва се от: BA1 (алелна честота > 5%), BS1 (повишена честота), PM2 (отсъства в контролните популации), BS2 (брой хомозиготи)
Източник: gnomad.broadinstitute.org
ClinVar
Твърдения за клинично значение, нива на експертен преглед, асоциации с болести, информация за подателя
Използва се от: PS1 (известен патогенен вариант), PP5 (надежден източник за патогенност), BP6 (надежден източник за доброкачественост), логика за приоритет на ClinVar, спасяване от филтър за качество
Източник: ncbi.nlm.nih.gov/clinvar
dbNSFP
Предсказания за функционално въздействие от множество алгоритми, оценки за еволюционна консервираност
Използва се от: Основен инструмент за PP3/BP4: BayesDel_noAF с прагове, калибрирани от ClinGen SVI (Pejaver et al. 2022). Показвани предиктори: SIFT, AlphaMissense, MetaSVM, DANN, PhyloP, GERP (достъпни за клиничен преглед, без участие в логиката за класификация)
Източник: sites.google.com/site/jpopgen/dbNSFP
SpliceAI
Предсказания за въздействие върху сплайсинга (4 делта оценки: поява на акцепторно място, загуба на акцепторно място, поява на донорно място, загуба на донорно място)
Използва се от: PP3_splice (максимална оценка ≥ 0,2), ограничение за BP4 (максимална оценка < 0,1), BP7 (проверка за сплайсингов ефект при синонимни варианти)
Източник: Illumina / Ensembl
gnomAD Constraint
Показатели за генна консервираност, отразяващи поносимостта към варианти със загуба на функция и към миссенс варианти
Използва се от: PVS1 (нетолерантност към загуба на функция), PP2 (консервираност спрямо миссенс варианти), BP1 (поносимост към загуба на функция)
Източник: gnomad.broadinstitute.org
MANE Select Transcripts
Дефиниции на каноничните транскрипти с координати на началото и края на CDS (кодираща последователност) за всеки белтък-кодиращ ген. MANE Select е единственият представителен транскрипт за всеки ген, утвърден съвместно от NCBI и Ensembl. MANE Plus Clinical обхваща допълнителни клинично значими транскрипти за 66 гена.
Използва се от: Позиционно ограничение по MANE за PVS1 (версия 3.22.0, HELIX-CR-2026-055): варианти извън CDS на MANE Select не получават PVS1 или PM4. Агрегиране на pext на ниво екзон (CR-056): стойностите на pext се изчисляват за всеки CDS екзон на MANE Select.
Източник: NCBI / EMBL-EBI / MANE Consortium
gnomAD pext (Proportion Expressed)
Дял на експресията на ниво екзон в 49 тъкани от GTEx v10. За всяка позиция в кодиращата последователност pext измерва каква част от общата генна експресия преминава през тази позиция. Агрегира се до ниво екзон като mean_pext (средноаритметична стойност за всички тъкани) и max_tissue_pext (максимум за 49-те тъкани). За класификация се използва max_tissue_pext, за да се избегнат фалшиво отрицателни резултати при гени с тъканно специфична експресия.
Използва се от: Ограничение за PVS1, отчитащо експресията (версия 3.23.0, HELIX-CR-2026-056): max_tissue_pext ≥ 0,9 → PVS1 Very Strong (много силно доказателство), 0,1–0,9 → PVS1 се понижава до Strong (силно доказателство), < 0,1 → PVS1 се блокира. Двоично ограничение за PM4 (блокира се при стойност < 0,1). Научна основа: Cummings 2020 PMID:32461655.
Източник: gnomAD / Broad Institute
HPO (Multi-Source Enriched)
Асоциации ген–фенотип, обединени от 6 експертно прегледани източника: HPO Consortium (5173 гена), картирания болест–HPO от Orphanet (3176 гена с данни за честота), 7 клинични панела от DECIPHER G2P (2125 гена), Monarch Initiative (4791 гена), верижно картиране P/LP от ClinVar–MedGen (5258 гена) и ръчен експертен преглед. Подреждане по приоритет на източника с филтриране по ниво на достоверност.
Използва се от: PP4 (съответствие между фенотипа на пациента и фенотипа, асоцииран с гена), услуга за фенотипно съответствие (семантично оценяване на сходство), услуга за скрининг (приближение за клиничната широта на гена)
Източник: HPO Consortium + Orphanet + G2P + Monarch + ClinVar-MedGen
ClinGen
Оценки за чувствителност към генна доза (хаплонедостатъчност, триплочувствителност)
Използва се от: PVS1 (haploinsufficiency_score = 3 като резервен критерий за консервираност при гени, разположени на X хромозомата, версия 3.11.5), BS1 (приближение за честотен праг според начина на унаследяване), BP2 (в положение trans с патогенен вариант при рецесивен модел)
Източник: clinicalgenome.org
Orphanet / Orphadata
Анотации за връзката ген–болест–начин на унаследяване при редки болести (автозомно-доминантно, автозомно-рецесивно, доминантно унаследяване, свързано с X хромозомата, рецесивно унаследяване, свързано с X хромозомата)
Използва се от: BS1 (честотен праг според начина на унаследяване: за автозомно-доминантно и за свързано с X хромозомата доминантно унаследяване от Orphanet → 0,1%, за автозомно-рецесивно от Orphanet → 5%), критерий за допускане на PVS1 според асоциация с болест (за да се приложи PVS1, генът трябва да присъства в Orphanet)
Източник: orphadata.com (INSERM, France)
ClinGen VCEP Specifications
Ген-специфични прагове за критериите по ACMG от експертните панели на ClinGen за подбор на варианти (Variant Curation Expert Panels)
Използва се от: BA1, BS1, PM2 (ген-специфични честотни прагове), PVS1 (критерий за допускане при гени с механизъм на придобиване на функция), критерий за допускане на PVS1 според асоциация с болест
Източник: cspec.genome.network
DECIPHER G2P
Асоциации ген–болест от 7 експертно прегледани клинични панела: DD (нарушения в развитието), очни, сърдечни, кожни, скелетни, онкологични и слухови. Всеки запис включва изискване за алели (брой и тип засегнати алели), молекулярен механизъм (придобиване на функция, загуба на функция, доминантно-негативен ефект) и ниво на достоверност (определително, силно, умерено). Данните за молекулярния механизъм се използват от ограничението при PVS1 за гени с механизъм придобиване на функция или доминантно-негативен ефект (версия 3.17.0).
Използва се от: Процес за обогатяване на HPO (3-ти от 6 източника, версия 3.12.0). Ограничение при PVS1 за придобиване на функция и доминантно-негативен ефект: изгледът gof_genes_unified съдържа 348 моноалелни гена с чист механизъм на придобиване на функция, доминантно-негативен ефект или печалба на експресия, при които PVS1 се блокира (версия 3.18.0, HELIX-REF-003). Източници: G2P (199 гена), GoFCards (179 гена), ръчен експертен преглед (27 гена). Гените с двоен механизъм са изключени от изгледа, за да се запази възможността PVS1 да се прилага при фенотипове, обусловени от загуба на функция.
Източник: DECIPHER / Wellcome Sanger Institute
Monarch Initiative
Асоциации ген–фенотип, обединени от препредаването на данни от HPO Consortium чрез Monarch Knowledge Graph. Широко покритие на връзките ген–болест от множество биомедицински онтологии.
Използва се от: Процес за обогатяване на HPO (4-ти от 6 източника). Широкообхватното генно покритие допълва първичните данни от HPO Consortium.
ClinVar-MedGen HPO Mapping
Асоциации ген–фенотип, изведени от подадените в ClinVar патогенни и вероятно патогенни (P/LP) варианти, картирани през MedGen CUI (концептуални уникални идентификатори) към HPO термини. Веригата е: вариант P/LP от ClinVar → ген → болест (MedGen CUI) → HPO термини. Източникът внася най-много нови гени в процеса за обогатяване на HPO.
Използва се от: Процес за обогатяване на HPO (5-ти от 6 източника). Обхваща 5258 гена, в това число много, които не присъстват в първичните данни на HPO Consortium или Orphanet.
Източник: NCBI ClinVar + MedGen
UniProt SwissProt
Експертно подбрана белтъчна последователност и анотация на функционални особености за прегледания човешки протеом. Функционални анотации на ниво аминокиселинен остатък, извлечени от плоския файлов формат на SwissProt: DISULFID (дисулфидни мостове), ACT_SITE (активни центрове на ензими), BINDING (места за свързване на субстрат или кофактор), MOD_RES (посттранслационни модификации) и MOTIF (функционални мотиви). Включва кръстосани препратки между UniProt и Ensembl за директно търсене по ENSP идентификатор по време на класификацията.
Използва се от: PM1 Ниво 1 (основно) - доказателства от критични функционални остатъци на ниво аминокиселинен остатък (версия 3.30.0, HELIX-CR-2026-082). 113 126 особености, допустими за PM1, в 14 278 белтъка заместват предишната логика, базирана само на Pfam домейни на ниво домейн (увеличение на плътността на доказателствата 2262 пъти спрямо версия 3.28). Допустимостта се определя от наличието на квалификатор (произволно /evidence= или /note=); особеностите без квалификатори се изключват по подразбиране, с възможност за конфигурационно изключение за клинични случаи.
InterPro / Pfam
Изчерпателен каталог за класификация на белтъчни домейни от Pfam. Пълният набор от записи на Pfam е зареден в референтната база заедно с идентификатор на домейна, тип (домейн, семейство, повтарящ се мотив или мотив) и функционална анотация. Критичните функционални домейни са маркирани като резервно доказателство за PM1 Ниво 2 (запазени за региони, дефинирани от VCEP, и за доказателства на ниво домейн, които все още не са обхванати с резолюция на ниво аминокиселинен остатък от UniProt Ниво 1, версия 3.30.0).
Използва се от: Резервно доказателство за PM1 Ниво 2 (откриване на критични функционални домейни чрез признака is_critical, версия 3.15.0). Около 50 домейна са маркирани като критични в 14 категории: киназни, ДНК-свързващи, йонни канали, GTP-азни, протеазни, сигнални, тумор-супресорни, калциево-свързващи, структурни, рецепторни, слухови, ядрени хормонални рецептори, убиквитинови и РНК-свързващи. Мигриран към архитектура Pattern A с Parquet като основен формат във версия 3.30.0 (HELIX-CR-2026-082, Фаза 5).
Източник: EMBL-EBI InterPro
ClinGen Gene-Disease Validity
Класификации на валидността на връзката ген–болест (определителна, силна, умерена, ограничена) с начин на унаследяване при автозомно-доминантни, автозомно-рецесивни и свързани с X хромозомата нарушения. Подбрани от експертните панели на ClinGen за подбор на гени (Gene Curation Expert Panels).
Използва се от: Критерий за допускане на PVS1 според консервираността (гени, класифицирани като автозомно-доминантни с определителна или силна валидност, заобикалят оценките pLI и LOEUF, версия 3.16.6). Заобикаляне на PVS1 при автозомно-рецесивни гени със загуба на функция (автозомно-рецесивни гени с определителна или силна валидност и потвърден механизъм на загуба на функция, версия 3.16.0). Критерий за допускане според асоциация с болест за PVS1, PP3_Strong, LP4/LP5/LP6 и приоритет на ClinVar (версия 3.16.0).
Източник: clinicalgenome.org
GoFCards
Експертно прегледана база данни с варианти, свързани с придобиване на функция, и експериментални доказателства (от животински модели, от клетъчни модели), сигнални пътища, асоциации с нарушения и патентована оценка на доказателствата (Pscore). Всеки запис за вариант включва PMID, функционално описание и статус на експериментална валидация.
Използва се от: Ограничение при PVS1 за придобиване на функция чрез изгледа gof_genes_unified (версия 3.18.0, HELIX-REF-003). Агрегиране на ниво ген: гени с 3 или повече експертно прегледани варианта с придобиване на функция, средна Pscore ≥ 2,0 и поне един вариант с доказателства от животински или клетъчен модел се квалифицират като гени с придобиване на функция със „силна" достоверност. 217 гена са преминали прага и са интегрирани в таблицата gene_disease_mechanism.
ClinGen Dosage Sensitivity (Full)
Пълна експертна оценка на чувствителността към генна доза, включваща оценка за хаплонедостатъчност (0–3, 30, 40), оценка за триплочувствителност, до 6 PMID идентификатора на ген, дата на последна преоценка и идентификатори на болести. Замества предишната таблица clingen с три колони (версия 3.18.0). Стойности на оценката за хаплонедостатъчност (HI): 0 - без доказателства, 1 - малко доказателства, 2 - формиращи се доказателства, 3 - достатъчни доказателства, 30 - автозомно-рецесивен фенотип, 40 - чувствителност към генна доза малко вероятна.
Използва се от: Критерий за допускане на PVS1 според консервираността (стойност на HI равна на 3 като резервен критерий при гени, разположени на X хромозомата, версия 3.11.5). Критерий за допускане според асоциация с болест (стойност на HI равна на 2, 3 или 30 съгласно HELIX-CR-2026-025, версия 3.18.1). Приближение за BS1 според начина на унаследяване. BP2 (стойност на HI равна на 30 за автозомно-рецесивен фенотип).
Източник: clinicalgenome.org
Ensembl VEP
Предсказване на молекулярната последица за всеки вариант, въздействие върху белтъка, анотация на транскриптите и картиране на функционалните домейни
Използва се от: PVS1 (тип молекулярна последица), PM1 (Pfam домейни), PM4 (in-frame инсерции и делеции, запазващи рамката на четене), BP3 (некритични региони), BP7 (синонимни варианти), всички критерии, базирани на въздействието
Източник: ensembl.org
ACMG/AMP класификация
Всеки вариант се класифицира по насоките на ACMG/AMP 2015 през 28 доказателствени критерия. От тях 19 се оценяват автоматично, а останалите 9 изискват преценка от генетика.
Ред на приоритет при класификация
Класификацията следва строг ред на приоритет. Правилата се проверяват отгоре надолу и първото, което съвпадне, определя крайния резултат:
BA1 - самостоятелен критерий
Ако честотата на алела надвишава 5%, вариантът се класифицира като „Доброкачествен“ без изключение. BA1 е единственият самостоятелен критерий в ACMG и никакво друго доказателство не може да го отмени, включително класификациите от ClinVar.
Противоречиви доказателства
Когато за един вариант едновременно са налице патогенни доказателства със сила Moderate или по-висока (PVS, PS или PM) и силни доброкачествени доказателства (BS), резултатът е VUS. Това е целенасочено консервативен подход - клиничната безопасност е над всичко.
Приоритет на ClinVar класификацията
Класификацията от ClinVar се взема предвид само ако няма противоречиви изчислителни доказателства и има поне 1 звезда за качество на прегледа. VUS от ClinVar не замества изчислителната класификация.
Байесова точкова система
Всеки задействан критерий носи точки според силата си: Very Strong (+8), Strong (+4), Moderate (+2), Supporting (+1) за патогенни; Strong (-4), Supporting (-1) за доброкачествени. Сборът определя класификацията: 10 или повече - Патогенен, 6–9 - Вероятно патогенен, 0–5 - VUS, от -1 до -5 - Вероятно доброкачествен, -6 или по-малко - Доброкачествен. Системата е математически еквивалентна на оригиналните 18 правила за комбиниране на доказателства от ACMG и същевременно обхваща комбинации, които те не адресират изрично.
По подразбиране
Ако нито едно от горните правила не съвпадне, вариантът получава VUS (с неясно значение).
Изход от класификацията
Всеки вариант получава една от петте ACMG класификации, придружена от списък на задействаните критерии със силата им (например „PVS1,PM2,PP3_Strong“), общ сбор на точките и стойност на достоверност, показваща колко далеч е резултатът от най-близкия праг:
Патогенен
>= 10 pts
достоверност: 0.80-0.99
Вероятно патогенен
6-9 pts
достоверност: 0.70-0.90
VUS
0-5 pts
достоверност: 0.30-0.60
Вероятно доброкачествен
-1 to -5 pts
достоверност: 0.70-0.90
Доброкачествен
<= -6 pts
достоверност: 0.80-0.99
Автоматизирани критерии (19 от 28)
Следните 19 критерия се прилагат автоматично за всеки вариант, преминал филтъра за качество. По-долу са описани точните условия, прагове, използвани бази данни и известни ограничения за всеки от тях.
Патогенни доказателства
Нулев вариант в ген, при който загубата на функция е известен механизъм на заболяване
Условия:
- Въздействие (Impact) = HIGH
- Последица: изместване на рамката (frameshift), поява на стоп-кодон (stop_gained), вариант в акцепторен (splice_acceptor) или донорен (splice_donor) сплайс-сайт
- Генна нетолерантност: pLI > 0.9 ИЛИ LOEUF < 0.35 ИЛИ генът е в подбрания списък на автозомно-рецесивни гени със загуба на функция (~150 гена с окончателни или силни доказателства за биалелен механизъм на заболяване чрез загуба на функция) ИЛИ ClinGen haploinsufficiency_score = 3 ИЛИ генът е в подбрания списък на автозомно-доминантни гени с варианти със загуба на функция в ClinVar (АД гени с патогенни/вероятно патогенни варианти със загуба на функция в ClinVar при 2+ звезди за преглед, но с неинформативна нетолерантност по gnomAD, v3.13.0)
- Намаление за последен екзон и безсмислено-опосредствано разграждане (v3.9.0): Скъсяващи варианти в последния екзон се намаляват от PVS1 Very Strong (+8 точки) до PVS1_Strong (+4 точки). Вариантите в последния екзон избягват безсмислено-опосредственото разграждане на иРНК (NMD), защото няма последващо екзон-екзонно съединение. Полученият скъсен белтък може да запази частична функция или да упражни доминантно-негативен ефект. Откриването използва колоната exon_number от VEP (формат X/Y): последен екзон, когато X == Y. Гени с един екзон (1/1) коректно получават PVS1_Strong. Липсваща или празна стойност на exon_number по подразбиране дава Very Strong (консервативен подход). Източник: Abou Tayoun et al. 2018, Фигура 1, Възел 3.
- Позиционна защита по MANE Select (v3.22.0, HELIX-CR-2026-055): Варианти извън кодиращата област (CDS) на MANE Select/Plus Clinical не получават PVS1 или PM4. VEP може да анотира варианти срещу неканонични транскрипти, които се простират извън каноничната кодираща последователност, произвеждайки погрешни предсказания за загуба на функция. 19 354 MANE транскрипта са заредени с координати на кодиращата област. Липсващи MANE данни = PVS1 приложен (консервативен резервен подход). Източник: Abou Tayoun et al. 2018, PMID:30192042.
- Защита, съобразена с експресията (v3.23.0, HELIX-CR-2026-056): оценки за дела на експресия по транскрипти (pext) на ниво екзон от gnomAD v4.1 (GTEx v10, 49 тъкани) модулират PVS1. Три нива въз основа на max_tissue_pext: >= 0.9 = PVS1 Very Strong (без промяна), 0.1–0.9 = PVS1_Strong[pext] (намален до Strong), < 0.1 = PVS1 блокиран (екзонът не се експресира в нито една тъкан). Липсваща pext стойност = Very Strong (консервативен резервен подход). PM4 блокиран при pext < 0.1. Научна основа: Cummings 2020 (PMID:32461655) - 22,8% от погрешните варианти с предполагаема загуба на функция са филтрирани, < 4% от истински патогенните варианти са пропуснати.
Изключения:
- Транскрипти, избягващи безсмислено-опосредственото разграждане (последицата съдържа NMD_escaping_variant). Бележка: NMD_transcript_variant НЕ се изключва - той показва, че транскриптът преминава през NMD, което е доказателство ЗА загуба на функция (v3.11.3).
- Неканонични варианти в сплайс-сайтове: splice_donor_5th_base_variant (позиция +5), splice_donor_region_variant (позиции +3 до +8), splice_acceptor_5th_base_variant (позиция −5). Дървото за решения по ClinGen PVS1 определя само канонични позиции +/−1,2. Разширените варианти в сплайс-области запазват достъп до PP3_splice (v3.11.4).
- Гени с придобиване на функция, доминантно-негативен или механизъм с усилена експресия: многоизточникова защита (v3.18.0, HELIX-REF-003). Първичен източник: обединен изглед gof_genes_unified (348 чисти моноалелни гена с придобиване на функция, доминантно-негативен или механизъм с усилена експресия от G2P + GoFCards + ръчен подбор, с ниво на достоверност окончателно/силно/умерено). Резерв: подбран списък GOF_AD_GENES (29 гена, включително ANKRD26, C1QTNF5, CALM2, MYH3, PRKAG2, SKI, TUBB3 и още 22 с документиран чрез PMID механизъм, различен от загуба на функция). Гени с двоен механизъм (например SCN5A, LMNA, KCNH2, MYH7) са изключени от изгледа и запазват приложимост на PVS1. Дърво за решения по ClinGen PVS1 (Abou Tayoun 2018): „Дали загубата на функция е известен механизъм на заболяване?“ - ако НЕ, PVS1 не е приложим.
- История на защитата за гени с придобиване на функция: v3.16.8 (HELIX-CR-2026-022) въведе GOF_AD_GENES (36 подбрани гена). v3.17.0 (HELIX-CR-2026-023) добави G2P като първичен източник, намали GOF_AD_GENES до 14 резервни гена и поправи грешката за двоен механизъм при GNAS.
- Варианти със запазен или загубен стоп-кодон
- HLA генова фамилия (HLA-A, HLA-B, HLA-C, HLA-DRA, HLA-DRB1, HLA-DRB5, HLA-DQA1, HLA-DQB1, HLA-DPA1, HLA-DPB1, HLA-E, HLA-F, HLA-G, HLA-DMA, HLA-DMB, HLA-DOA, HLA-DOB)
- Хомозиготни референтни генотипове (hom_ref) от мултиалелни VCF позиции
Бази данни: VEP (последица, въздействие), gnomAD Constraint (pLI, LOEUF), подбран списък на АР гени със загуба на функция (ClinGen Gene-Disease Validity), подбран списък на АД гени с варианти със загуба на функция в ClinVar (v3.13.0), Orphanet (асоциация ген–заболяване), ClinVar (проверка на ниво ген за P/LP), ClinGen (haploinsufficiency_score), VCEP (генно покритие), обединен изглед gof_genes_unified (348 гена с придобиване на функция, доминантно-негативен или механизъм с усилена експресия от G2P + GoFCards + ръчен подбор, v3.20.1), резерв GOF_AD_GENES (29 гена, v3.20.1), таблица gene_disease_mechanism (проверка за асоциация със заболяване, v3.18.2), MANE Select транскрипти v1.4 (позиционна защита, v3.22.0), gnomAD pext v4.1 GTEx v10 (защита, съобразена с експресията, v3.23.0)
Ограничения:
- Не оценява възстановяване на четящата рамка чрез последващо повторно стартиране в рамката
- Тъканно-специфичната експресия се оценява чрез gnomAD pext (дел на експресия по транскрипти, GTEx v10) за модулация на PVS1 и PM4 (v3.23.0, HELIX-CR-2026-056). Екзони с максимална тъканна pext стойност < 0.1 блокират PVS1; 0.1–0.9 намаляват PVS1 до Strong. Употребата на алтернативни транскрипти се адресира чрез позиционната защита по MANE Select (v3.22.0, HELIX-CR-2026-055): варианти извън кодиращата област на MANE Select не получават PVS1 или PM4.
- VCEP ген-специфична проверка за приложимост на PVS1 е налична за ~50–60 гена (например PVS1 е деактивиран за гени с придобиване на функция като MYOC). Обща защита за гени с придобиване на функция, доминантно-негативен или механизъм с усилена експресия чрез gof_genes_unified (347 гена от G2P + GoFCards + ръчен подбор) + резерв GOF_AD_GENES (28 гена) покрива всички останали известни гени с механизъм, различен от загуба на функция (v3.18.0, HELIX-REF-003). За всички останали гени се използват общи прагове.
- Заобикалянето за автозомно-рецесивни гени използва подбран списък от ~150 гена с окончателна или силна валидност по ClinGen или еквивалентни публикувани доказателства за биалелен механизъм на заболяване чрез загуба на функция. VCEP АР гените (например CDH23, GJB2, MYO7A, PAH, SLC26A4, USH2A) се обработват чрез проверката VCEP pvs1_applicable и не се дублират в подбрания списък. Покрити категории: невродегенерация, метаболитни (аминокиселини, окисление на мастни киселини, гликогенно натрупване, лизозомни, пероксизомни), цилиопатии, сензорни (слух, зрение), имунни/хематологични, сърдечни, нервно-мускулни, съединителна тъкан, бъбречни, ендокринни, чернодробни и респираторни.
- Заобикалянето за автозомно-доминантни гени с варианти със загуба на функция в ClinVar (v3.13.0) използва подбран списък на АД гени с патогенни/вероятно патогенни варианти със загуба на функция в ClinVar (2+ звезди за преглед), но с неинформативна нетолерантност по gnomAD (pLI < 0.9, LOEUF >= 0.35, HI != 3). Насочен е към малки гени, при които нетолерантността по gnomAD е статистически слабо мощна. Нови гени се добавят само при клиничен повод и проверка. Източник: Abou Tayoun 2018 PMID:30192042, HELIX-CR-2026-010.
Същата аминокиселинна промяна като установен патогенен вариант
Условия:
- Клинично значение по ClinVar: патогенен (Pathogenic), патогенен/вероятно патогенен (Pathogenic/Likely_pathogenic) или вероятно патогенен (Likely_pathogenic)
- Звезди за преглед по ClinVar >= 2
Бази данни: ClinVar (клинично значение, звезди за преглед)
Ограничения:
- Съпоставяне на точна позиция и алел на варианта, не на аминокиселинна позиция (PM5 съпоставянето на ниво аминокиселина е деактивирано)
- ClinVar класификациите може да изостават спрямо текущите доказателства за наскоро прекласифицирани варианти
Разположен в мутационна гореща точка или добре установен функционален домейн
Условия:
- Последица: missense_variant (v3.20.1, HELIX-CR-2026-035). PM1 е дефиниран за варианти с променен смисъл (missense) в критични функционални домейни (Richards 2015 Таблица 3, ClinGen SVI Walker 2023 Раздел 3.3). Синонимни варианти, варианти с изместване на рамката, варианти в сплайс-сайтове и други варианти, различни от missense, не получават PM1.
- Триниво PM1 модел на доказателства (v3.30.0, HELIX-CR-2026-082):
- Ниво 1 (ОСНОВНО) - доказателство на ниво остатък от UniProt: вариантът припокрива подбран критичен остатък от прегледания човешки протеом в UniProt SwissProt. 113 126 PM1-допустими характеристики в 14 278 белтъка, покриващи DISULFID (дисулфидни връзки), ACT_SITE (ензимни активни центрове), BINDING (свързване на субстрат/кофактор), MOD_RES (пост-транслационни модификации) и MOTIF (функционални мотиви). Съпоставянето се извършва чрез кръстосана препратка по Ensembl белтък (ENSP) на точната белтъчна позиция, извлечена от hgvs_protein. Допустимостта на доказателствата се определя от наличието на квалификатор в UniProt (някой /evidence= или /note=); характеристики без квалификатор са изключени по подразбиране (2067 характеристики, 1,8%).
- Ниво 2 (РЕЗЕРВ) - критични домейни по InterPro Pfam: вариантът припокрива критичен функционален домейн от референтната таблица interpro_pfam_domains (~50 домейна, маркирани като критични, от каталога InterPro Pfam, v3.15.0). Запазено за VCEP-дефинирани региони и доказателства на ниво домейн, които все още не са обхванати с резолюция на ниво остатък.
- Ниво 3 (РЕЗЕРВИРАНО) - VCEP-специфични замествания на PM1 региони: бъдещо разширение за ген-специфични дефиниции на PM1 региони от публикувани спецификации на експертни панели по подбор на варианти (ClinGen VCEP).
- PM1 се задейства, ако Ниво 1 ИЛИ Ниво 2 съвпадне. Запазена единична сила Moderate (без разделяне на нива Moderate/Supporting) за съвместимост със съществуващите правила за комбиниране.
Бази данни: VEP (последица, hgvs_protein), прегледан човешки протеом UniProt SwissProt (референтни таблици uniprot_features и uniprot_ensembl_mapping, v3.30.0), InterPro Pfam (референтна таблица interpro_pfam_domains)
Ограничения:
- Характеристики без квалификатор в UniProt (без /evidence= или /note=, 2067 характеристики) са изключени от PM1 допустимост по подразбиране. Конфигурационен флаг pm1_uniprot_include_naked позволява клинично заобикаляне за специфични случаи, при които включването от експерта в SwissProt се третира като доказателство за експертен подбор (например INSR Cys234Tyr, дисулфидна връзка Cys223–Cys234).
- Доказателствата от UniProt са на ниво остатък; някои VCEP ген-специфични PM1 региони (критични региони с множество остатъци, дефинирани от експертни панели по подбор на варианти) все още не са интегрирани и разчитат на резервното ниво с Pfam.
- Ниво 2 (резерв с Pfam) запазва обхвата на подбор от v3.15.0: ~50 критични домейна в 14 категории (каталитични домейни на кинази, ДНК-свързващи домейни, пори на йонни канали, активни центрове на ензими и други VCEP-документирани домейни). Общи структурни домейни (Caveolin, навити спирали, DUF) и повтарящи се региони остават изключени.
- Източникът на PM1 доказателство се записва в одитна колона pm1_evidence_source за всяко PM1 попадение (формат: uniprot:DISULFID:223-234:P06213 или pfam:PF00069), позволяващ преглед на произхода за вариант и показване на доказателствата в потребителския интерфейс.
Отсъстващ от контроли или с изключително ниска честота в популационни бази данни
Условия:
- Глобална честота на алела по gnomAD < 0.0001 (0,01%) ИЛИ вариантът отсъства от gnomAD (липсваща честота = никога не наблюдаван при ~800 хил. индивиди)
- Липсваща честота на алела по gnomAD коректно се третира като „отсъстващ от контроли“ съгласно Richards et al. 2015 Таблица 3
Бази данни: gnomAD v4.1 (глобална честота на алела)
Ограничения:
- Не прилага корекции за специфични за популация честоти
- Намаление до PM2_Supporting по ClinGen SVI, въведено за VCEP гени (v3.20.0, HELIX-CR-2026-034). 46 VCEP гена използват PM2 със сила Supporting; 11 гена запазват Moderate (RASopathy, ENIGMA BRCA1/2, HBOP). Гени извън VCEP използват пълна сила Moderate.
- Когато са активирани VCEP ген-специфичните спецификации, прагът за PM2 може да се различава от общия 0.01% (например 0% за RASopathy гени, при които всяка популационна честота говори срещу патогенност)
Открит в транс-конфигурация с патогенен вариант при рецесивни заболявания
Условия:
- Вариантът е маркиран като кандидат за съставна хетерозиготност (compound_het_candidate = true)
- Валидация на партньора по ClinVar (v3.25.1, HELIX-CR-2026-058): партньорът в транс-конфигурация трябва да е патогенен или вероятно патогенен по ClinVar с брой звезди за преглед >= 2 и да не е с противоречива оценка. Съответства на Richards 2015 Таблица 3: PM3 изрично изисква „открит в транс-конфигурация с патогенен вариант“. Анотацията от ClinVar е външна и неизменяема, което избягва кръгова зависимост, при която класификацията на партньора зависи от PM3.
Изключения:
- Изключване за гени с придобиване на функция или доминантно-негативен механизъм (v3.20.2, HELIX-CR-2026-036): PM3 не се прилага за чисти гени с придобиване на функция или доминантно-негативен механизъм. PM3 предполага автозомно-рецесивен механизъм (Richards 2015 Таблица 3), биологично неприложим за гени с доминантно заболяване.
- Заобикаляне при двоен механизъм (v3.20.3, HELIX-CR-2026-037): гени с едновременно моноалелен механизъм на придобиване на функция/доминантно-негативен И биалелен механизъм на загуба на функция (изглед gof_genes_exclusive, 55 гена с двоен механизъм, изключени от защитата за придобиване на функция) запазват PM3 за автозомно-рецесивния път на загуба на функция.
Бази данни: Вътрешен за процеса (откриване на съставна хетерозиготност), ClinVar (клинично значение на партньора, звезди за преглед), изглед gof_genes_exclusive (G2P + GoFCards + ръчен подбор, 347 гена с придобиване на функция/доминантно-негативен/усилена експресия минус 55 с двоен механизъм), резерв GOF_AD_GENES
Ограничения:
- Статусът на съставна хетерозиготност се извежда от генотипни данни без формално определяне на фаза
- Данни от трио или определяне на фаза с дълги четения биха предоставили окончателно потвърждение на транс-конфигурацията
- Партньорът по ClinVar изисква 2+ звезди за преглед; партньори с подавания с 1 звезда (P/LP) не удовлетворяват PM3
Промяна в дължината на белтъка в неповтаряща се област
Условия:
- Последица: вмъкване със запазена рамка (in-frame insertion) или делеция със запазена рамка (in-frame deletion)
- Разположен в Pfam функционален домейн
- Не в повтаряща се или нискосложна област (домейните не съдържат „tandem“, „repeat“, „lowcomplexity“ или „Seg“)
Изключения:
- HLA генова фамилия (същия списък за изключване като PVS1)
Бази данни: VEP (последица, домейни)
Ограничения:
- Откриване на повтарящи се региони е базирано само на VEP анотации на домейни
- Не оценява дали промяната със запазена рамка нарушава критичен функционален остатък
Вариант с променен смисъл (missense) в ген с ниска честота на доброкачествена missense вариация
Условия:
- Последица: вариант с променен смисъл (missense)
- Генна нетолерантност: pLI > 0.5 И mis_z > 2.0 (нетолерантност към варианти с променен смисъл)
- Проверка за асоциация със заболяване (v3.18.5): генът трябва да има установена асоциация със заболяване чрез същите 7 източника като PVS1 проверката. Предотвратява PP2 при гени без известен Менделов механизъм на заболяване.
- Регионална нетолерантност по MPC (v3.18.6, HELIX-CR-2026-032): mpc_score >= 1.0 е необходим, когато има налични MPC данни. Региони с mpc_score < 1.0 са нетолерантни към варианти с променен смисъл - PP2 е блокиран. Липсващи MPC данни се връщат към нетолерантност на ниво ген (заобикаляне). Източник: Samocha et al. 2014.
Бази данни: VEP (последица), gnomAD Constraint (pLI, mis_z), регионална нетолерантност по MPC (mpc_score), асоциация със заболяване (7 източника)
Ограничения:
- pLI измерва нетолерантност към загуба на функция; mis_z измерва нетолерантност към варианти с променен смисъл
- И двете метрики са необходими: pLI > 0.5 гарантира нетолерантност към загуба на функция, mis_z > 2.0 гарантира, че вариантите с променен смисъл са механизъм на заболяване (Samocha et al. 2014)
- Регионални данни по MPC са налични за ~18 хил. гена. Липсващи MPC данни връщат само към нетолерантност на ниво ген.
Изчислителни доказателства подкрепят вреден ефект (два независими пътя)
Условия:
- Път A (варианти с променен смисъл - BayesDel): Изисква последица = missense_variant (v3.12.1, HELIX-CR-2026-009). BayesDel_noAF е калибриран изключително за варианти с променен смисъл (Pejaver et al. 2022); варианти с друга последица (stop_gained, изместване на рамката) получават неточни оценки от позиционно припокриване в dbNSFP и са изключени. Три нива на сила: PP3_Strong (>= 0.518, +4 точки), PP3_Moderate (0.290–0.517, +2 точки), PP3_Supporting (0.130–0.289, +1 точка). Оценки под 0.130 са неопределени. Изисква защита за релевантност на варианти с променен смисъл v2.0 (v3.19.0, HELIX-CR-2026-033): 5 проверки определят дали промяната на смисъла е механизъм на заболяване. Проверка 1: mis_z > 2.0 (директна нетолерантност). Проверка 2: mis_z > 1.5 И pLI < 0.5 (АР гени). Проверка 3: mis_z > 0.5 И pLI > 0.9 (АД гени, нетолерантни към загуба на функция). Проверка 4a: генът е в refdb.clinvar_missense_genes (2136 гена с доказателства за патогенни/вероятно патогенни варианти с променен смисъл в ClinVar). Проверка 4b: pLI > 0.7 И mis_z > 0.5 И генът има асоциация със заболяване (гени в сива зона). Резервен подход при липсващи данни: pLI > 0.5 без данни за mis_z. PP3_Strong допълнително изисква установена асоциация със заболяване (проверка от v3.8.1, същите 7 източника като проверката за PVS1).
- Защита от двойно отчитане PM1 + PP3: Когато PM1 (функционален домейн) се прилага заедно с PP3_Strong, PP3 се намалява до PP3_Moderate. Комбинираното PM1 + PP3 е ограничено до еквивалент на сила Strong (4 точки) съгласно ClinGen SVI.
- Път B (доказателства за сплайсинг - 3 нива на сила, v3.15.1): максималната оценка по SpliceAI се оценява с модулация на силата на доказателствата. PP3_splice_Strong (>= 0.8, +4 точки), PP3_splice_Moderate (0.5–0.799, +2 точки), PP3_splice (0.2–0.499, +1 точка, подкрепящо). PP3_splice_Strong изисква проверка за асоциация със заболяване (същата като PP3_Strong за варианти с променен смисъл). Всички нива се изключват, когато PVS1 се прилага (защита срещу двойно отчитане, ClinGen SVI 2023).
- Пътищата A и B са независими. Един вариант може да задейства и двата, ако има оценка по BayesDel и предсказание за сплайсинг.
Изключения:
- PP3_splice не се прилага, когато PVS1 е задействан на което и да е ниво на сила (Very Strong или Strong за последен екзон). Предотвратява двойно отчитане на доказателства за загуба на функция и сплайсинг съгласно ClinGen SVI 2023.
- Защита на PP3_splice за поносими варианти с променен смисъл (v3.25.7, HELIX-CR-2026-065): PP3_splice (всички нива) е блокиран за чисти варианти с променен смисъл без последица за сплайсинг по VEP, когато данни от BayesDel noAF са налични. ClinGen SVI (Walker 2023 Раздел 3.2): PP3 е единичен критерий - когато BayesDel показва поносим вариант, а SpliceAI предсказва криптичен сплайсинг, доказателствата са противоречиви, не кумулативни. Заобикалянето при липсващи данни от BayesDel се запазва.
- Взаимно изключване PP3 + PP3_splice (v3.25.8, HELIX-CR-2026-066): за варианти с двойна последица (променен смисъл И сплайс-област/донор/акцептор), PP3 по BayesDel е блокиран, когато PP3_splice се прилага. SpliceAI е по-специфичният инструмент, когато VEP потвърждава близост до сплайс-сайт. Заедно с v3.25.7 - точно един PP3 път на вариант, никога и двата.
- BayesDel неопределен диапазон (-0.180 до 0.129): не се прилага PP3 или BP4
Бази данни: dbNSFP 4.9c (оценка bayesdel_noaf), SpliceAI (максимална оценка)
Ограничения:
- BayesDel_noAF се използва за избягване на кръгова логика с честотните критерии PM2/BA1/BS1 (Pejaver et al. 2022)
- Ограничението PM1 + PP3 предполага PM1 = Moderate (2 точки). Разширяемо при бъдеща VCEP надстройка на PM1 силата.
- BayesDel не достига PP3_Very_Strong съгласно калибрационните данни на Pejaver
Фенотипът на пациента е силно специфичен за заболяване с единична генетична етиология
Условия:
- Изисква HPO термини на пациента да са предоставени за аналитичната сесия
- Условие за задействане A: >= 3 HPO термина на пациента съвпадат с HPO профила на гена
- Условие за задействане B: >= 2 HPO термина на пациента съвпадат И генът има <= 5 общо HPO асоциации (силно специфична връзка ген-фенотип)
Изключения:
- Не се оценява, когато не са предоставени HPO термини за пациента
Бази данни: HPO (асоциации ген-фенотип)
Ограничения:
- HPO съпоставянето е точно припокриване на термини, не семантично сходство (онтологичната йерархия не се използва на този етап)
- Семантично-базирано съпоставяне се извършва от последващата услуга за фенотипно съпоставяне
Уважаван източник съобщава варианта като патогенен
Условия:
- Клинично значение по ClinVar: патогенен (Pathogenic), патогенен/вероятно патогенен (Pathogenic/Likely_pathogenic) или вероятно патогенен (Likely_pathogenic)
- Звезди за преглед по ClinVar >= 1 И < 2 (по-ниска увереност от PS1)
Изключения:
- Не се прилага, когато PS1 вече се прилага (предотвратява двойно отчитане на ClinVar доказателства на различни нива на сила)
Бази данни: ClinVar (клинично значение, звезди за преглед)
Ограничения:
- ClinGen SVI препоръча оттегляне на PP5 като самостоятелен критерий; запазен за максимална чувствителност
Доброкачествени доказателства
Честотата на алела е над 5% в популационни бази данни
Условия:
- Глобална честота на алела по gnomAD > 0.05 (5%)
Бази данни: gnomAD v4.1 (глобална честота на алела)
Ограничения:
- Използва само глобална честота на алела; специфични за популацията BA1 прагове не са въведени
BA1 е единственият самостоятелен ACMG критерий. Вариант, удовлетворяващ BA1, се класифицира като „Доброкачествен“ независимо от всички други доказателства, включително ClinVar класификации. Когато са активирани VCEP ген-специфичните спецификации, прагът BA1 може да е по-нисък от 5% за конкретни гени (например 0.1% за гени за кардиомиопатия).
Честотата на алела е по-висока от очакваното за заболяването
Условия:
- Праг за честота, съобразен с начина на унаследяване, определен чрез 5-нивов каскаден алгоритъм (v3.7.0):
- Приоритет 1 - VCEP ген-специфичен: BS1 праг от публикувана ClinGen VCEP спецификация (~100 гена)
- Приоритет 2 - ClinGen HI score = 3: честота на алела >= 0.001 (0.1%) (~400 гена)
- Приоритет 3 - Orphanet AD унаследяване: честота на алела >= 0.001 (0.1%) за гени с автозомно-доминантна асоциация със заболяване (~1694 гена)
- Приоритет 3b - Х-свързано доминантно унаследяване по Orphanet: честота на алела >= 0.001 (0,1%) за гени с Х-свързана доминантна асоциация със заболяване (~90 гена). Гените с Х-свързано рецесивно унаследяване умишлено се изключват (връщат се към АР по подразбиране).
- Приоритет 4 - Резерв по HPO за АД: честота на алела >= 0.001 (0,1%) за гени, анотирани с HP:0000006 (автозомно-доминантно унаследяване) (~200–400 допълнителни гена)
- По подразбиране - АР праг: честота на алела >= 0.05 (5%) за всички останали гени
- Горна граница: честота на алела <= BA1 праг (BA1 има приоритет)
Изключения:
- Не се прилага, когато се прилага BA1 (BA1 има приоритет)
- Гени с Х-свързано рецесивно унаследяване не получават АД прага - носителките са незасегнати и се очакват по-високи честоти на носителство
Бази данни: gnomAD v4.1 (глобална честота на алела), ClinGen (haploinsufficiency_score), Orphanet/Orphadata (orphanet_gene_inheritance: has_ad, has_ar, has_xld), HPO (hpo_ids за HP:0000006), gnomAD Constraint (pLI, oe_lof_upper за резерв с изведен от нетолерантност АД статус), подбран списък AR_LOF_GENES
Ограничения:
- Orphanet покрива само редки заболявания; някои чести AD състояния може да не са каталогизирани (покрити от HPO AD резерв или AR по подразбиране)
- Гени с двойно АД+АР унаследяване (1027 гена, например KCNJ11) получават АД прага (0,1%) като консервативна стойност по подразбиране - АР патогенните варианти обикновено са значително под 0,1% честота на алела
- Orphanet данните се актуализират два пъти годишно (издания юни + декември). Покритието се разширява с всяко издание.
- Когато са активирани VCEP ген-специфичните спецификации, VCEP праговете имат най-висок приоритет и заместват всички други нива на каскадата
- Низът с критерии включва анотация за източника на унаследяване: BS1[ClinGen-HI], BS1[Orphanet-AD], BS1[Orphanet-XLD], BS1[HPO-AD]
Източник на данни: Orphadata (INSERM, Франция). Лиценз: CC-BY-4.0. Атрибуция: Orphadata: Free access data from Orphanet. INSERM 1999. Достъпно на https://www.orphadata.com.
Наблюдаван при здрав възрастен индивид за напълно пенетрантно заболяване с ранно начало
Условия:
- Праг, съобразен с унаследяването (v3.26.8, HELIX-CR-2026-074): гени само с АР унаследяване (Orphanet has_ar=TRUE, has_ad=FALSE ИЛИ ClinGen HI=30) с документирани заболявания само с ранно начало използват праг от 10 хомозиготи. Общи и АД гени използват праг от 15 хомозиготи.
- Защита по начало: АР прагът се активира само когато генът съществува в refdb.orphanet_disease_onset (липса на данни връща към общия 15) И никое свързано заболяване няма начало в зряла/напреднала възраст или начало във всички възрасти. Съответства на Richards 2015 Таблица 3: BS2 „с пълна пенетрантност, очаквана в ранна възраст“.
- Маркер за АР пътя в низа с критерии: BS2[AR], когато е използван АР прагът.
Изключения:
- АД BS2 от броя хомозиготи в gnomAD не е въведен (Harrison 2019 PMID:31159682: gnomAD е обща популация, не здрави контроли; APC VCEP Curia 2023 PMID:37805481 изключва gnomAD за АД BS2).
- Х-свързан хемизиготен BS2 е отложен (колоната ac_hemi не е в текущия процес на анотация).
Бази данни: gnomAD v4.1 (брой хомозиготи), Orphanet (orphanet_gene_inheritance, orphanet_disease_onset), ClinGen (haploinsufficiency_score, HI=30 като заместител за АР)
Ограничения:
- АР прагът от 10 е калибриран за АР заболявания с ранно начало и пълна пенетрантност. Гени с АР заболявания с късно начало (например болест на Уилсън, ATP7B) се връщат към общия праг 15 чрез защитата по начало.
- АР заболявания само със съставна хетерозиготност изискват интерпретация на броя хомозиготи в контекста на честотата на носителство; в момента не се моделират отделно.
Вариант с променен смисъл (missense) в ген, при който предимно скъсяващите варианти са известни като причинители на заболяване
Условия:
- Последица: вариант с променен смисъл (missense)
- Въздействие (Impact): MODERATE
- Генна нетолерантност: pLI < 0.1 (генът толерира загуба на функция)
- Стойността на pLI трябва да е налична (не липсваща)
- Защита за нетолерантност към варианти с променен смисъл (v3.6.8): mis_z трябва да е < 2.0 или липсващ. Гени с висок mis_z имат промяната на смисъла като основен механизъм на заболяване.
- Защита за патогенен вариант с променен смисъл по ClinVar (v3.8.2): BP1 не се прилага, когато ClinVar има патогенен/вероятно патогенен вариант с променен смисъл в същия ген в текущата сесия. Ако ClinVar потвърди патогенен вариант с променен смисъл в пациентския VCF, предпоставката на BP1 се обезсилва.
- Защита на ниво референция за варианти с променен смисъл по ClinVar (v3.20.9, HELIX-CR-2026-044): BP1 допълнително блокиран, когато генът е в refdb.clinvar_missense_genes (>= 2 патогенни/вероятно патогенни варианти с променен смисъл по ClinVar при 2+ звезди). Проверка на ниво референция покрива гени с установен механизъм на заболяване чрез промяна на смисъла, които не присъстват в текущия пациентски VCF (разширява защитата на ниво сесия).
- Изключване за гени с придобиване на функция или доминантно-негативен механизъм (v3.20.6, HELIX-CR-2026-039v2): BP1 не се прилага за варианти с променен смисъл в гени с придобиване на функция или доминантно-негативен механизъм. BP1 предполага механизъм на загуба на функция (Richards 2015 Таблица 3); гените с придобиване на функция или доминантно-негативен механизъм имат скъсяващ механизъм, различен от загуба на функция, така че предпоставката на BP1 е неприложима. Същите източници на защита като защитата на PVS1 за придобиване на функция: refdb.gof_genes_exclusive + резерв GOF_AD_GENES.
Изключения:
- Гени с mis_z >= 2.0 (промяната на смисъла е известен механизъм на заболяване)
- Гени с патогенни/вероятно патогенни варианти с променен смисъл по ClinVar в текущата сесия
- Гени с доказателства за варианти с променен смисъл по ClinVar на ниво референция (refdb.clinvar_missense_genes, 2136 гена)
- Гени с придобиване на функция или доминантно-негативен механизъм (изглед refdb.gof_genes_exclusive + резерв GOF_AD_GENES)
- Подбрани АР гени със загуба на функция (~150 гена с биалелен механизъм на заболяване чрез загуба на функция)
Бази данни: VEP (последица, въздействие), gnomAD Constraint (pLI, mis_z), ClinVar (клинично значение, последица), refdb.clinvar_missense_genes (механизъм чрез промяна на смисъла на ниво референция), refdb.gof_genes_exclusive (G2P + GoFCards + ръчен подбор), GOF_AD_GENES, AR_LOF_GENES
Ограничения:
- Нисък pLI се използва като приближение за „предимно скъсяващите варианти причиняват заболяване“
- mis_z измерва хетерозиготна нетолерантност към варианти с променен смисъл. АР ензимни гени (например MCCC2) могат да имат нисък mis_z въпреки патогенни хомозиготни варианти с променен смисъл - защитите за варианти с променен смисъл по ClinVar (v3.8.2 на ниво сесия + v3.20.9 на ниво референция) адресират тази празнина.
- Покритието на гени с придобиване на функция или доминантно-негативен механизъм е ограничено до G2P издание 2026-02-28 + GoFCards Release 1.0 + подбран GOF_AD_GENES. Гени с нов механизъм, различен от загуба на функция, които все още не са подбрани, могат да получат некоректен BP1.
Наблюдаван в транс-конфигурация с патогенен вариант за напълно пенетрантно доминантно заболяване
Условия:
- Кандидат за съставна хетерозиготност (compound_het_candidate = true)
- ClinGen оценка за хаплонедостатъчност = 30 (чувствителност към генна доза малко вероятна)
Бази данни: Вътрешен за процеса (откриване на съставна хетерозиготност), ClinGen (haploinsufficiency_score)
Ограничения:
- Наблюдението в транс-конфигурация се извежда без формално определяне на фаза
- Оценка за хаплонедостатъчност 30 е специфичен ClinGen код за „чувствителност към генна доза малко вероятна“
Инсерция или делеция със запазена рамка в повтаряща се област без известна функция
Условия:
- Последица: вмъкване със запазена рамка (in-frame insertion) или делеция със запазена рамка (in-frame deletion)
- Разположен в повтаряща се или нискосложна област (домейните съдържат „tandem“, „repeat“, „lowcomplexity“ или „Seg“), ИЛИ не в нито един Pfam домейн, ИЛИ няма налична анотация за домейн
Бази данни: VEP (последица, домейни)
Ограничения:
- Допълващ на PM4 (PM4 изисква Pfam домейн; BP3 изисква отсъствие на критичен домейн)
Изчислителните доказателства предполагат липса на въздействие върху гена или генния продукт
Условия:
- Път A (варианти с променен смисъл - BayesDel): Изисква последица = missense_variant (v3.12.1, HELIX-CR-2026-009). BayesDel_noAF е оценен с калибрирани прагове по ClinGen SVI (Pejaver et al. 2022). Две нива на сила: BP4_Moderate (<= -0.361, -2 точки), BP4_Supporting (-0.360 до -0.181, -1 точка). Максималната оценка по SpliceAI трябва да е < 0.1 или липсваща.
- Път B (неканоничен сплайсинг - BP4_splice): v3.25.2 (HELIX-CR-2026-060). Подкрепящо доброкачествено доказателство за варианти в неканонични сплайс-области (splice_donor_region, splice_donor_5th_base, splice_acceptor_5th_base, splice_region и splice_polypyrimidine_tract), когато максималната оценка по SpliceAI <= 0.1. Изключва синонимни (BP7 ги обработва) и варианти с променен смисъл (BP4 по BayesDel ги обработва). Защита за PVS1: не се прилага, когато условието за PVS1 е удовлетворено (без двойно отчитане на доказателства за сплайсинг и загуба на функция). Праг, съответстващ на BP7 (SpliceAI <= 0.1). Източници: Jaganathan 2019 PMID:30661751, Walker 2023 PMID:37352859, de la Hoya 2022 PMID:35202600.
- Маркер в низа с критерии: BP4 (път по BayesDel) и BP4_splice (път за неканоничен сплайсинг) се отчитат отделно.
Изключения:
- Неопределен диапазон на BayesDel (-0.180 до 0.129): не се прилага BP4 по пътя за варианти с променен смисъл
- BP4_splice не се прилага, когато PVS1 е задействан (каноничен сплайсинг +/-1,2 с преминаване на проверката за нетолерантност)
Бази данни: dbNSFP 4.9c (оценка bayesdel_noaf), SpliceAI (максимална оценка), VEP (последица)
Ограничения:
- BayesDel_noAF не достига BP4_Strong съгласно калибрационните данни на Pejaver
- Защитата по SpliceAI предотвратява пътя на BP4 за варианти с променен смисъл при варианти с предсказано въздействие върху сплайсинга
- BP4_splice покрива само последици в неканонични сплайс-области. Дълбоко интронни варианти без етикети за сплайсинг от VEP изискват валидация чрез РНК съгласно ClinGen SVI (Walker 2023).
Уважаван източник съобщава варианта като доброкачествен
Условия:
- Клинично значение по ClinVar: доброкачествен (Benign), доброкачествен/вероятно доброкачествен (Benign/Likely_benign) или вероятно доброкачествен (Likely_benign)
- Звезди за преглед по ClinVar >= 1
Бази данни: ClinVar (клинично значение, звезди за преглед)
Ограничения:
- ClinGen SVI препоръча оттегляне на BP6 като самостоятелен критерий; запазен за максимална чувствителност
Синонимен вариант без предсказано въздействие върху сплайсинга
Условия:
- Последица: синонимен вариант
- Не е в сплайс-област (последицата не съдържа „splice_region“)
- Максимална оценка по SpliceAI <= 0.1 или липсваща
Бази данни: VEP (последица), SpliceAI (максимална оценка)
Ограничения:
- Филтърът за консервираност умишлено е пропуснат съгласно препоръката на Walker et al. 2023 Таблица S13 („без подобрение на отрицателната предсказваща стойност“ при филтър за консервираност)
Съответства на дървото за решения от ClinGen SVI 2023 (Walker et al.) Фигура 4 за класификация на синонимни варианти.
Изчислителни предиктори (PP3 / BP4)
За PP3 и BP4 Helena използва BayesDel_noAF - Байесова система, която обединява оценките от множество предиктори в една калибрирана стойност. Праговете са по калибрацията на ClinGen SVI (Pejaver et al. 2022). Версията без честота на алела (noAF) е избрана, за да не се получи кръгова зависимост с честотните критерии PM2, BA1 и BS1.
| BayesDel_noAF стойност | Сила на доказателството | ACMG код | Байесови точки |
|---|---|---|---|
| >= 0.518 | Силно патогенно | PP3_Strong | +4 |
| 0.290 - 0.517 | Умерено патогенно | PP3_Moderate | +2 |
| 0.130 - 0.289 | Подкрепящо патогенно | PP3_Supporting | +1 |
| -0.180 to 0.129 | Неопределено | Няма | 0 |
| -0.360 to -0.181 | Подкрепящо доброкачествено | BP4_Supporting | -1 |
| <= -0.361 | Умерено доброкачествено | BP4_Moderate | -2 |
Защита от двойно отчитане PM1 + PP3
Ако PM1 (функционален домейн, 2 точки) и PP3_Strong (4 точки) се приложат едновременно, общият им принос би надхвърлил тавана на ClinGen SVI от 4 точки за ниво Strong. Затова PP3_Strong се намалява до PP3_Moderate (2 точки) и общият сбор става 2 + 2 = 4. PP3_Moderate и PP3_Supporting не се засягат.
Защо BayesDel
ClinGen SVI калибрира четири инструмента (BayesDel, MutPred2, REVEL, VEST4) и установи, че един калибриран инструмент с модулирана сила на доказателствата дава по-точни резултати от консенсус на няколко предиктора с фиксирани прагове. BayesDel_noAF е избран, защото не включва честотата на алела в модела си (без кръгова зависимост с PM2/BA1/BS1), наличен е предварително изчислен в dbNSFP 4.9c и покрива най-широкия диапазон от нива на сила - от PP3_Strong до BP4_Moderate.
Предиктори за справка (не се използват в класификацията)
Следните предиктори са достъпни за всеки вариант, но не участват в класификацията по PP3/BP4. Преди v3.4 те се използваха в подход с претеглен консенсус и сега са запазени само за справка:
Интеграция със SpliceAI
Предсказанията за въздействие върху сплайсинга са интегрирани съгласно препоръките на работната група ClinGen Sequence Variant Interpretation (SVI) (Walker et al., 2023).
SpliceAI оценява как всеки вариант влияе на сплайсинга на иРНК чрез четири делта-стойности: поява на акцепторно място (DS_AG), загуба на акцепторно място (DS_AL), поява на донорно място (DS_DG) и загуба на донорно място (DS_DL). За праговете на класификация се взема най-високата от четирите.
Стойностите идват от предварително изчислени предсказания на Ensembl за MANE транскрипти - не се изчисляват в реално време. Така резултатите са възпроизводими и не зависят от външни услуги.
Прагове
- SpliceAI >= 0.8 → PP3_splice_Strong: Силно доказателство за нарушен сплайсинг (+4 точки). Генът трябва да има установена връзка с болест (v3.15.1).
- SpliceAI 0.5 - 0.799 → PP3_splice_Moderate: Умерено доказателство за нарушен сплайсинг (+2 точки).
- SpliceAI 0.2 - 0.499 → PP3_splice_Supporting: Подкрепящо доказателство за нарушен сплайсинг (+1 точка).
- SpliceAI < 0.1 → BP4 проверка: Необходимо условие за BP4. Блокира доброкачествената класификация, ако има предсказано въздействие върху сплайсинга.
- SpliceAI <= 0.1 → BP7: Необходимо за класификация на синонимни варианти по BP7 - потвърждава, че сплайсингът не е засегнат.
Защита от двойно отчитане при PVS1
Ако за варианта вече е задействан PVS1 (загуба на функция), PP3_splice не се прилага. Така един и същ биологичен механизъм - нарушен сплайсинг, водещ до загуба на функция - не се отчита двойно като PVS1 и PP3, съгласно препоръката на ClinGen SVI.
Източник: Walker et al., Am J Hum Genet. 2023;110(7):1046-1067. PMID: 37352859
Логика на класификация
Класификацията работи по Байесовата точкова система (Tavtigian et al. 2018, 2020). Тя дава същите резултати като оригиналните 18 правила за комбиниране на доказателства от ACMG, но покрива и случаи, които насоките от 2015 г. не разглеждат изрично.
Байесова точкова система (основна)
Всеки критерий носи точки според силата си, а класификацията се определя от техния сбор:
Точки за патогенни доказателства
- Very Strong (PVS)+8
- Strong (PS)+4
- Moderate (PM)+2
- Supporting (PP)+1
Точки за доброкачествени доказателства
- Самостоятелен (BA1)Директно „Доброкачествен“
- Strong (BS)-4
- Supporting (BP)-1
Прагове за класификация
Патогенен
>= 10 точки
Вероятно пат.
6 - 9 точки
VUS
0 - 5 точки
Вероятно добр.
-1 - -5 точки
Доброкачествен
<= -6 точки
Проверка за конфликт с висока достоверност
Ако силно патогенно доказателство (Strong или Very Strong) влезе в пряко противоречие със силно доброкачествено (BS), вариантът се маркира за ръчен преглед, колкото и да е сборът на точките. Така наистина противоречиви доказателства от високо качество не се разрешават автоматично.
ACMG 2015 правила за комбиниране (за справка)
Оригиналните 18 правила за комбиниране на доказателства от ACMG 2015 са частен случай на Байесовата точкова система - всяко правило произвежда една и съща класификация при двата подхода. Запазени са тук за справка.
Патогенен (8 правила)
- P1: 1 Very Strong (PVS) + >= 1 Strong (PS)
- P2: 1 Very Strong (PVS) + >= 2 Moderate (PM)
- P3: 1 Very Strong (PVS) + 1 Moderate (PM) + 1 Supporting (PP)
- P4: 1 Very Strong (PVS) + >= 2 Supporting (PP)
- P5: >= 2 Strong (PS)
- P6: 1 Strong (PS) + >= 3 Moderate (PM)
- P7: 1 Strong (PS) + 2 Moderate (PM) + >= 2 Supporting (PP)
- P8: 1 Strong (PS) + >= 4 Moderate (PM)
Вероятно патогенен (7 правила)
- LP1: 1 Very Strong (PVS) + 1 Moderate (PM) - ограничен от ar_biallelic_het_lof_guard (v3.25.5): блокиран при хетерозиготен вариант със загуба на функция в гени само с автозомно-рецесивна загуба на функция без партньор в съставна хетерозиготност (състояние на носителство)
- LP1b: 1 Very Strong (PVS) или PVS1_Strong + >= 1 Supporting (PP) - съобразено с ClinGen SVI PM2 намалението (v3.20.0); същата защита за хетерозиготен вариант със загуба на функция като LP1
- LP2: 1 Strong (PS) + 1-2 Moderate (PM) - ограничен от защитата за изчислително-само LP (v3.25.6 CR-064 / v3.25.9 CR-067): блокиран когато единственият Strong е PP3_Strong или PP3_splice_Strong със само PM2 и без PP4/PP5/PS1/PM3/PM4. v3.27.2 CR-081: изключение за PP3_splice_Strong при AD/XL гени, нетолерантни към загуба на функция, с асоциация със заболяване и сплайс близост.
- LP3: 1 Strong (PS) + >= 2 Supporting (PP) - същата защита за хетерозиготен вариант със загуба на функция като LP1
- LP4: >= 3 Moderate (PM) - изисква gene_has_disease_association (v3.16.7 CR-021); блокиран от ar_biallelic_missense_guard (v3.25.3 CR-061), computational_only_lp_guard (v3.25.4 CR-062), ar_biallelic_het_lof_guard (v3.25.5 CR-063)
- LP5: 2 Moderate (PM) + >= 2 Supporting (PP) - същата проверка за асоциация със заболяване и трите защити като LP4
- LP6: 1 Moderate (PM) + >= 4 Supporting (PP) - същата проверка за асоциация със заболяване и трите защити като LP4
Доброкачествен (2 правила)
- B1: 1 Stand-alone (BA1) - честота > 5%
- B2: >= 2 действителни Strong доброкачествени (BS1, BS2) - v3.26.6 (BB-007): изрично броене само на критерии със сила Strong. BP4_Moderate (Moderate доброкачествен по Pejaver 2022) се включва в bs_count за участие в LB1, но се изключва от B2. Tavtigian 2020 (PMID:32720330): BS1(-4) + BP4_Moderate(-2) = -6 точки = LB, не B (изисква <= -7 точки).
Вероятно доброкачествен (2 правила)
- LB1: 1 Strong доброкачествен (BS или BP4_Moderate, съпоставен с bs_count) + 1 Supporting доброкачествен (BP)
- LB1b: 1 действителен Strong доброкачествен (BS1 или BS2) + BP4_Moderate - v3.26.6 (BB-007) изрично последващо правило: Tavtigian BS1(-4) + BP4_Moderate(-2) = -6 точки = LB. Предотвратява BS1 + BP4_Moderate (без друг BP) да попадне грешно във VUS.
- LB2: >= 2 Supporting доброкачествени (BP)
Обработка на противоречиви доказателства
В повечето случаи точковата система разрешава противоречията автоматично. Например PM2 (+2) и BS1 (-4) дават сбор -2, което е Вероятно доброкачествен. В старата система (преди v3.3) същата комбинация щеше да бъде означена като противоречива и да остане VUS - точковият подход е по-прецизен. Когато обаче силно патогенно доказателство (Strong или Very Strong) влезе в пряк конфликт със силно доброкачествено, вариантът отива за ръчен преглед независимо от сбора (вижте „Проверка за конфликт с висока увереност“ по-горе). BA1 си остава самостоятелен критерий с най-висок приоритет.
Ген-специфични спецификации на VCEP
За някои гени и болести ClinGen поддържа експертни панели (VCEP), които адаптират общите ACMG/AMP 2015 критерии с ген-специфични прагове. Helena ги прилага като допълнение към стандартната класификация.
Как работи
Първо се изпълнява стандартната ACMG класификация за всички варианти. Ако за даден ген има VCEP спецификация, ген-специфичните прагове влизат в сила - променят се честотните граници (BA1, BS1, PM2) и условията за PVS1. Накрая сборът на точките се преизчислява с новите стойности.
Какво променят VCEP спецификациите
- BA1: Праг на честотата за самостоятелен доброкачествен критерий, различен от общия 5% (например 0,1% при гени за кардиомиопатия)
- BS1: Праг за повишена честота, съобразен с начина на унаследяване на конкретния ген
- PM2: Праг за „отсъстващ в контролни популации“, адаптиран за конкретния ген (например 0% при RASopathy гени)
- PVS1: Проверка дали PVS1 е приложим за конкретния ген. Изключен е при гени с механизъм „придобиване на функция“ (например MYOC при глаукома)
Включване и изключване
VCEP спецификациите са включени по подразбиране, но могат да се изключат за всеки отделен случай. Когато са активни, вариантите в покрити от VCEP гени носят маркер (например „[VCEP:Hearing Loss v1.0]“) в списъка с критерии.
Покритие
Спецификациите са от ClinGen Criteria Specification Registry (CSpec). Около 50–60 гена са покрити - сред тях панели за загуба на слуха, кардиомиопатия (MYH7, MYBPC3), RASopathy (PTPN11, BRAF, SOS1), PTEN, CDH1, TP53, PAH и BRCA1/BRCA2 (ENIGMA). За останалите гени важат общите ACMG 2015 прагове.
Приоритет на ClinVar класификацията
Helena взема предвид класификациите от ClinVar, но само когато няма конфликт с изчислителните доказателства.
Кога ClinVar класификацията има приоритет
ClinVar класификацията се приема, когато има поне 1 звезда за качество на прегледа и няма противоречиви изчислителни доказателства (нито BA1, нито едновременни патогенни и доброкачествени критерии със сила Moderate или по-висока). При P/LP с 1 звезда (един подател) генът трябва да има и установена връзка с болест от поне един от пет източника: ClinVar P/LP на ниво ген (с 2+ звезди, за да се избегне самовалидация), Orphanet, ClinGen хаплонедостатъчност, списък на автозомно-рецесивни гени със загуба на функция или VCEP покритие (v3.10.0, корекция v3.10.1). При 2+ звезди тази допълнителна проверка отпада. Класификациите B (доброкачествен) и LB (вероятно доброкачествен) не подлежат на нея.
Кога ClinVar класификацията НЕ се прилага
ClinVar класификацията не се прилага в следните случаи: BA1 е активен (честота > 5% винаги е с приоритет). Налице са противоречиви доказателства. ClinVar дава VUS (не замества изчислителния резултат). Броят звезди е под минималния праг. ClinVar P/LP има само 1 звезда за ген без установена връзка с болест (v3.10.0, корекция v3.10.1 - на ниво ген ClinVar изисква 2+ звезди срещу самовалидация).
Минимален брой звезди по подразбиране: 1 (може да се промени за всяко внедряване)
Когато ClinVar класификацията се приеме, в списъка с критерии се добавя „ClinVar“ на първо място (например „ClinVar,PM2,PP3“). Ако е блокирана от проверката за връзка с болест, на първо място стои „ClinVar_gated“ - класификацията е била налична, но не е приложена. Броят звезди от ClinVar е видим за всеки вариант, за да може генетикът да прецени надеждността.
Критерии за ръчен преглед (9 от 28)
Тези 9 критерия не могат да се определят само от VCF файла на пациента. Те изискват допълнителна информация - семейна сегрегация, функционални проучвания, потвърден de novo статус или клиничен контекст - и се оценяват от генетика.
De novo вариант (потвърдени родителски връзки)
Изисква трио секвениране и потвърдени родителски връзки. Не може да се определи от анализ на единична VCF проба.
Установени in vitro или in vivo функционални проучвания показват вреден ефект
Изисква подбор на публикувани данни от функционални анализи. Автоматизирано извличане на функционални доказателства от литературата все още не е реализирано.
Честотата на варианта при засегнати индивиди е значително повишена в сравнение с контроли
Изисква данни от случай-контрола проучвания или съотношения на шансовете, които не са достъпни в стандартните анотационни бази данни.
Нова промяна с променен смисъл (missense) в аминокиселинен остатък, на който е наблюдавана различна патогенна промяна с променен смисъл
В момента деактивиран. Изисква нормализирано съпоставяне на HGVSp срещу ClinVar на ниво аминокиселинна позиция. Ще бъде активиран, когато обработката на ClinVar осигури стандартизирани белтъчни координати.
Предполагаемо de novo без потвърдено бащинство и майчинство
Изисква информация за фамилната структура, която не е налична при анализ на единична проба.
Косегрегация със заболяването при множество засегнати членове на семейството
Изисква мултигенерационни родословни данни и анализ на сегрегация.
Установени in vitro или in vivo функционални проучвания показват липса на вреден ефект
Изисква подбор на публикувани данни от функционални анализи (доброкачествен еквивалент на PS3).
Липса на сегрегация при засегнати членове на семейството
Изисква данни за фамилна сегрегация, които не са налични при анализ на единична проба.
Вариант, открит в случай с алтернативна молекулярна основа на заболяването
Изисква клинична информация за алтернативна диагноза на ниво случай.
Филтриране по качество
Преди анотация и класификация вариантите преминават през филтър за качество с три нива на строгост:
| Ниво | Качество (QUAL) | Дълбочина (DP) | Качество на генотипа (GQ) | Препоръчана употреба |
|---|---|---|---|---|
| Strict | >= 30 | >= 20 | >= 30 | Клинично докладване с висока достоверност |
| Balanced | >= 20 | >= 15 | >= 20 | Стандартен клиничен анализ (по подразбиране) |
| Permissive | >= 10 | >= 10 | >= 10 | Максимална чувствителност / изследвания |
Механизъм за спасяване чрез ClinVar
Варианти с известно клинично значение в ClinVar (патогенни или вероятно патогенни) не се отхвърлят, дори да не покриват праговете. Те се маркират като спасени и продължават към класификация. Така клинично значими находки не остават скрити заради ниско качество на секвениране в зони с лошо покритие - целенасочено решение в полза на клиничната безопасност.
Ограничения и уговорки
- Helena е инструмент за подкрепа на клиничното решение, не диагностично устройство. Всички класификации изискват преглед и потвърждение от квалифициран клиничен генетик.
- 9 от 28 ACMG критерия изискват информация, която не е налична от анализ на единична VCF проба (сегрегация, функционални проучвания, потвърждение на de novo). Тези критерии трябва да се оценят ръчно от прегледащия генетик.
- SpliceAI предсказанията са изчислителни. Проучванията на сплайсинга чрез РНК остават златен стандарт за потвърждение на ефекти, променящи сплайсинга.
- Данните за популационна честота от gnomAD може да подценяват определени етнически групи и географски популации. Праговете за честота на алела трябва да се интерпретират в контекста на произхода на пациента.
- ClinVar класификациите варират по качество и актуалност. Нивата на звезди за преглед се показват редом с всички ClinVar-извлечени доказателства, за да се позволи информирана интерпретация.
- Структурни варианти (SV), варианти в броя на копията (CNV) и експанзии на повторения не се класифицират от текущия процес.
- Митохондриалните варианти се обработват през същия процес, използвайки нуклеарните ACMG правила като приближение. Специализирани насоки за класификация на митохондриални варианти (например MitoMap критериите) все още не са имплементирани.
- VCEP ген-специфичните спецификации са имплементирани като настройка на праговете за BA1, BS1, PM2 и приложимостта на PVS1. Настройката не реализира специфичната за VCEP интерпретация на функционални анализи (PS3/BS3) или ген-специфична логика на сегрегация (PP1/BS4), които изискват ръчен подбор. Покритието е ограничено до около 50–60 гена с публикувани ClinGen CSpec спецификации; всички останали гени използват общите ACMG 2015 прагове.
- PM5 (нова промяна с променен смисъл (missense) на известна патогенна аминокиселинна позиция) в момента е деактивиран в очакване на стандартизирано съпоставяне на белтъчни координати в обработката на ClinVar.
- Откриването на съставна хетерозиготност се извежда от генотипни данни без определяне на фаза с дълги четения или трио анализ. Формално определяне на фаза трябва да се извърши за клинично потвърждение.
- Подбраният списък на автозомно-рецесивни гени със загуба на функция (~150 гена) за заобикаляне на PVS1 покрива гени с определителни или силни доказателства за биалелен механизъм на заболяване чрез загуба на функция. Автозомно-рецесивните гени извън този списък, които нямат нетолерантност (нисък pLI, висок LOEUF), няма да задействат PVS1, освен ако нямат ген-специфични спецификации от VCEP.
- Хомозиготни референтни генотипове (hom_ref) от мултиалелни VCF позиции се изключват от класификацията. Те представляват алели, които не присъстват в пациента.
- Защитните механизми за намаляване на погрешни класификации (v3.25.3 ar_biallelic_missense_guard, v3.25.4 computational_only_lp_guard, v3.25.5 ar_biallelic_het_lof_guard, v3.25.6 LP2 PP2 bypass корекция, v3.25.9 LP2 PP3_splice_Strong разширение, v3.26.6 B2 броене само на критерии със сила Strong) целенасочено намаляват „Вероятно патогенен“ до VUS или „Доброкачествен“ до „Вероятно доброкачествен“, когато доказателствата са само изчислителни или биологично несъвместими с механизма на гена. Тези защити намаляват погрешните положителни, но могат и да намалят варианти, които последващи функционални или сегрегационни доказателства биха повишили обратно. Прегледащите генетици трябва да третират намалените варианти като кандидати за допълнително събиране на доказателства, а не като крайни класификации.
- Сигнал за поносимост към загуба на функция от gnomAD (v3.24.0, HELIX-CR-2026-057): за варианти с въздействие HIGH извън CDS на MANE Select в гени с документирани хомозиготни или хемизиготни носители на варианти със загуба на функция сред здрави индивиди в gnomAD се прилага BP_regional като подкрепящ доброкачествен критерий (v3.25.0, CR-057 Фаза 3). Автозомно-доминантните гени са изключени - хетерозиготната поносимост към загуба на функция при автозомно-доминантно унаследяване е отделен клиничен аргумент. Кандидатите за съставна хетерозиготност са изключени - те могат да допринесат за биалелна загуба на функция.
- Защита срещу негативни ClinGen доказателства (v3.26.9, HELIX-CR-2026-078): гени с ClinGen Gene-Disease Validity класификации, ограничени до ограничена, оспорена или опровергана (без определителна, силна или умерена), вече не се приемат като имащи асоциация със заболяване само чрез запис в Orphanet. Това блокира приоритета на ClinVar при 1 звезда и правилата за LP при гени с негативна ClinGen оценка, предотвратявайки промоция от единичен подател в ClinVar при гени, които ClinGen е разгледал и е намерил недостатъчни доказателства.
- Резултатите винаги трябва да се интерпретират в контекста на клиничното представяне на пациента, фамилната анамнеза и друга налична клинична информация.
История на версиите
Всяка промяна в методологията получава нов номер на версия и е документирана тук. Версията съответства на класификационния модул в реална среда.
Покажи по-стари версии (72 още)
- PM1: интеграция на доказателства на ниво остатък от UniProt (HELIX-CR-2026-082). Триниво PM1 модел на доказателства замества логиката само с домейни по Pfam. Ниво 1 (основно): прегледан човешки протеом UniProt SwissProt, 113 126 PM1-допустими характеристики в 14 278 белтъка (DISULFID, ACT_SITE, BINDING, MOD_RES, MOTIF). Ниво 2 (резерв): критични домейни по InterPro Pfam (~50 домейна, запазено за региони, дефинирани от VCEP). Ниво 3 (резервирано): специфични за VCEP замествания на PM1 региони (бъдещо). PM1 булев непроменен (единична сила Moderate), запазващ съществуващите правила за комбиниране.
- Плътност на PM1 доказателствата: 2262-кратно увеличение спрямо v3.28 (50 твърдо зададени домейна по Pfam → 113 126 експертно подбрани остатъка от UniProt). Архитектурата следва Helena модел A (Parquet като източник на истина, DuckDB като разполагаем кеш). Извличането от hgvs_protein обработва липсващи, празни, разделени с вертикална черта множествени транскрипти, ENSP с премахнат суфикс за версия и защита само за последици с променен смисъл.
- Обработка на характеристики без квалификатор (Стратегия D): характеристики от UniProt без квалификатори /evidence= и /note= (2067 характеристики, 1,8% от общия брой) са изключени от PM1 допустимост по подразбиране. Конфигурационен флаг pm1_uniprot_include_naked позволява клинично заобикаляне за специфични случаи (например INSR Cys234Tyr, дисулфидна връзка Cys223–Cys234, характеристика без квалификатор DISULFID). Консервативно по подразбиране; включване по избор за пълно покритие от UniProt, когато включването от експерта в SwissProt се третира като доказателство за експертен подбор.
- Одитна следа: колоната pm1_evidence_source се попълва за всяко PM1 попадение (формат: uniprot:DISULFID:223-234:P06213 или pfam:PF00069). Панелът с детайли за варианта в потребителския интерфейс показва четим източник на доказателството с връзка към записа в UniProt. Замества обобщената анотация „PM1: критичен функционален домейн“.
- Поправка на зареждащия скрипт за InterPro Pfam по модел B: load_interpro_pfam.py е мигриран от директно изтриване на таблица и вмъкване към архитектура с Parquet като първичен източник, съответстваща на всички останали референтни набори данни. Речникът CRITICAL_DOMAINS е запазен като ръчен слой за замествания.
- Източник: Richards 2015 PMID:25741868 (дефиниция на PM1), Walker 2023 PMID:37352859 (ClinGen SVI Раздел 3.3), UniProt Consortium 2023 PMID:36408920.
- Преработка на пояснителните бележки (HELIX-CR-HEL-VA-2026-001): дедупликация на генерираните от класификатора пояснителни бележки, защитена чрез сигнални маркери. Всички 14 категории ACMG бележки са с префикс [ACMG]. Симетрична преработка в етапа за откриване на артефакти с маркер [ARTIFACT]. Премахва запазването на остарели бележки при повторни класификации (Находка 1: Случай 13 IFT140 с липсваща бележка за заобикаляне от категория 4) и N-кратно дублиране на бележки при повторни пускания на класификатора (Находка 2: AIRE сесии с 11–18-кратно дублиране). Нулеви промени в логиката на класификация.
- Инвариант на структурата на бележките: текстът на бележка с маркер [ACMG] или [ARTIFACT] не трябва да съдържа „; “ вътрешно. Бележките за множествени нуклеотидни варианти са структурно безопасни (разделяне/обединяване без загуба за вътрешен STRING_AGG).
- Обхват: acmg_classifier.py (18 фрагмента), artifact_detection_stage.py (3 фрагмента), rerun_classifier_pipeline.py (1 фрагмент).
- Заобикаляне на LP2 за сплайсинг при АД/Х-свързани гени с нетолерантност към загуба на функция (HELIX-CR-2026-081). Защитата на LP2 само за изчислителни доказателства (CR-042/064/067) е разширена със заобикаляне за PP3_splice_Strong (SpliceAI >= 0.8) при автозомно-доминантни или Х-свързани доминантни гени с нетолерантност към загуба на функция и установена асоциация със заболяване. SpliceAI >= 0.8 в ген със загуба на функция е качествено различно от PP3_Strong за варианти с променен смисъл по BayesDel + PM2: предсказание за нарушен сплайсинг с висока достоверност в ген с установен механизъм на загуба на функция се доближава до функционален заместител за загуба на функция.
- Шест задължителни условия за заобикалянето: has_pp3_splice_strong И НЕ has_pp3_strong И ad_lof_constraint_satisfied И генът има асоциация със заболяване И близост до сплайс-сайт е удовлетворена И НЕ извън MANE областта. Защитата по MANE предотвратява заобикалянето от повторно активиране на LP чрез PP3_splice_Strong, когато PVS1 е блокиран по позиционни причини.
- ad_lof_constraint_satisfied изключва пътища само за АР (състояние на носителство, не хаплонедостатъчност), гени с придобиване на функция или доминантно-негативен механизъм чрез gof_genes_exclusive + GOF_AD_GENES (аналогично на PVS1 CR-022 v3.16.8) и гени с двоен механизъм и биалелна загуба на функция, които запазват само биалелния механизъм (съвместимо с CR-079: IFT140 запазва АД пътя).
- splice_proximity_satisfied изключва чисти варианти с променен смисъл (CR-066 обработва двойна последица), чисти синонимни без етикет за сплайсинг от VEP, варианти в нетранслируеми области и дълбоко интронни без етикет за сплайсинг от VEP (изисква валидация чрез РНК съгласно Walker 2023).
- Допълваща промяна: от VUS към LP. Не може да създаде нови B/LB или да премахне съществуващи P/LP. Клиничен повод: HG2024_252 TCOF1 c.1279-6C>G VUS спрямо патогенен по CG.
- Източник: Jaganathan 2019 PMID:30661751, Walker 2023 PMID:37352859, Abou Tayoun 2018 PMID:30192042, Richards 2015 PMID:25741868.
- Поправка на приоритета на CASE за пояснителните бележки (HELIX-CR-2026-080). Единичната CASE структура с приоритет на първото съвпадение е заменена с независимо свързване чрез CASE WHEN. Варианти, съвпадащи с множество условия, вече получават всички приложими бележки, разделени с точка и запетая.
- Защита за категория 2 по pext: добавена проверка за НЕ извън MANE областта, за да се предотвратят противоречиви бележки, когато вариантът е едновременно извън MANE и има pext данни.
- Външна CASE защита: проверява дали поне едно условие съвпада преди влизане в свързването. В противен случай запазва оригиналните пояснителни бележки непроменени.
- Нулево въздействие върху класификацията: без промени в acmg_class, acmg_criteria или стойността на увереност. Само кумулативни бележки. Повод: BBS9 p.Glu501Ter (Случай 3, HG2022_042) - бележката за намаление по pext маскираше бележката за ar_biallelic_het_lof_guard.
- Заобикаляне на защитата за загуба на функция при АД/АР гени с двоен механизъм (HELIX-CR-2026-079). Защитата ar_biallelic_het_lof (CR-063) е разширена със заобикаляне за гени с документиран моноалелен механизъм на загуба на функция. Защитата е проектирана за гени само с АР механизъм на загуба на функция (AMACR, CFTR, GBA1), при които хетерозиготната загуба на функция е състояние на носителство. Гени с двоен механизъм (биалелна загуба на функция + моноалелна загуба на функция) имат АД път, при който хетерозиготната загуба на функция е патогенна.
- Два пътя за заобикаляне: моноалелна загуба на функция по gene_disease_mechanism (с ниво на достоверност окончателно/силно/умерено) ИЛИ Python константа CLINVAR_LOF_AD_GENES (IFT140, GCM2). Пътят по ClinGen АД с ниво окончателно/силно е премахнат при преглед v2: АД начинът на унаследяване по ClinGen не разграничава загуба на функция от придобиване на функция/доминантно-негативен.
- Допълваща промяна: от VUS към LP за хетерозиготна загуба на функция в гени с двоен АД/АР механизъм на загуба на функция. Не може да създаде нови B/LB. Не може да премахне съществуващи P/LP. Засегнат ген: IFT140 (трети ген за АДПББ съгласно Senum 2022 PMID:34890546).
- Клиничен повод: IFT140 c.640del p.Val214CysfsTer55 (сесия 6692b88f). Фенотип: HP:0000107 (бъбречна киста). Прецедент: CR-037 (gof_genes_exclusive, v3.20.3) - аналогично заобикаляне за двоен механизъм при защитата на PVS1/PM3 за придобиване на функция.
- Защита срещу негативни доказателства по ClinGen (HELIX-CR-2026-078). Клонът за Orphanet в проверката за асоциация на гена със заболяване е защитен чрез CTE за гени с негативна оценка по ClinGen. Когато ClinGen е оценил даден ген И всички оценки са неприложими (ограничени/оспорени/отхвърлени, без окончателни/силни/умерени), само записът в Orphanet не е достатъчен за установяване на асоциация със заболяване.
- CTE за гени с негативна оценка по ClinGen: SELECT DISTINCT ген от ClinGen GDV, където класификацията е ограничена/оспорена/отхвърлена И генът НЕ е сред гените с установена асоциация със заболяване по ClinGen. ~480 гена. Материализирано от DuckDB.
- Засяга: проверката за приоритет на ClinVar при 1 звезда, проверката за заболяване при LP4/LP5/LP6, проверката за заболяване при PVS1, проверката за заболяване при PP3_Strong, проекцията за произход де ново при P6/P7/P8 и LP4/5/6.
- Намаляваща промяна: от LP към VUS за приоритет на ClinVar при 1 звезда в гени само с негативна оценка по ClinGen. Не може да създаде нови P/LP. 205 засегнати гена (Orphanet + само негативна оценка по ClinGen от общо 480).
- Клиничен повод: TNC p.Arg108His LP [ClinVar,BP4] (PD2025_120). ClinGen с ограничена оценка (VCEP за загуба на слуха). BayesDel = -0.322 (доброкачествен). pLI = 0.0.
- Източник: Strande 2017 PMID:28552198, Richards 2015 PMID:25741868.
- BS2 съобразен с унаследяването - АР праг (HELIX-CR-2026-074). Гени само с АР унаследяване (Orphanet has_ar=TRUE, has_ad=FALSE или HI=30) с документирани заболявания само с ранно начало използват праг от 10 хомозиготи (bs2_ar_homozygote_threshold) вместо общия (15).
- Защита по начало от refdb.orphanet_disease_onset (HELIX-REF-005). Проверка EXISTS: генът трябва да присъства в orphanet_disease_onset (липса на данни = общ праг). Проверка NOT EXISTS: генът не трябва да има начало в зряла/напреднала възраст или начало във всички възрасти. Съответства на Richards 2015 Таблица 3: BS2 „с пълна пенетрантност, очаквана в ранна възраст“.
- АД BS2 от броя хомозиготи в gnomAD не е въведен. Harrison 2019 PMID:31159682: gnomAD е обща популация, не здрави контроли. APC VCEP (Curia 2023 PMID:37805481) изключва gnomAD за АД BS2. Х-свързан BS2 е отложен (колоната ac_hemi не е в текущия процес на анотация).
- Низ с критерии: BS2[AR-hom:N] за АР пътя, BS2 за общия път. Намаляваща промяна: BS2 добавя само доброкачествено доказателство. Не може да създаде нови P/LP. 2 P → VUS чрез противоречиви доказателства (TGM5 p.Gly113Cys 14 хомозиготи, DUOX2 p.Phe966SerfsTer29 14 хомозиготи).
- Клиничен повод: HG2022_073 CBS p.Ala114Val P с 6 хомозиготи в gnomAD (CBS е изключен поради 6 < 10 праг и блокиране от защитата по начало за заболяване в зряла възраст).
- Поправка на минималния брой звезди за преглед при PS1 (HELIX-CR-2026-073). ps1_min_stars: 1 → 2 в processing.yaml. Замяна от YAML в commit 39f97c7e (2025-12-16) позволяваше PS1 (Strong) при 1 звезда по ClinVar, заобикаляйки проверката за асоциация със заболяване от v3.10.0. Стойността по подразбиране в кода вече беше 2.
- Възстановяване на PP5: варианти с 1 звезда по ClinVar P/LP вече коректно получават PP5 (Supporting) вместо PS1 (Strong). Диапазонът на PP5 (>= 1 И < 2) вече не е празно множество.
- Валидация на партньора при PM3: брой звезди за преглед на партньора >= ps1_min_stars (споделена конфигурация, идентична семантика съгласно Richards 2015 Таблица 3: и PS1, и PM3 изискват установен патогенен вариант). 0 PM3 варианта в работна среда имат партньор с 1 звезда за преглед (проверено в 151 сесии).
- Намаляваща промяна: PS1 премахнат от варианти с 1 звезда. Не може да създаде нови P/LP. 3 LP → VUS в 151 сесии (P4HA1, HLA-DRB1, NDUFAF7). И трите гена без асоциация със заболяване в Orphanet/ClinGen/gene_disease_mechanism.
- Клиничен повод: HG2022_016 P4HA1 chr10:73043951 LP [PS1,PM2] - дълбоко интронен в ген без асоциация със заболяване.
- Източник: Richards 2015 PMID:25741868 (Таблица 3, дефиниции на PS1/PM3), Walker 2023 PMID:37352859 (ClinGen SVI PS1 минимум 2 звезди).
- Изключване на BP4_Moderate от правилото за комбиниране B2 (Bug Bounty BB-007). B2 (>= 2 силни доброкачествени) е заменено с изричен сбор (has_bs1 + has_bs2) >= 2. BP4_Moderate (умерено доброкачествен, -2 точки по Tavtigian) некоректно се отчиташе в bs_count за задействане на B2, причинявайки B2 (>= 2 силни) да се задейства с 1 силен (BS1) + 1 умерен (BP4_Moderate). Richards 2015 Таблица 5 правило (ii): B2 изисква >= 2 силни доброкачествени. Tavtigian 2020 PMID:32720330: BS1(-4) + BP4_Moderate(-2) = -6 точки = ВД, не Д (изисква <= -7).
- bs_count непроменен: BP4_Moderate остава в bs_count за участие в LB1 (bs_count >= 1 И bp_count >= 1). Само проверката за B2 използва изричен сбор само на силни доказателства.
- Добавен преход LB1b: 1 действително силен доброкачествен (BS1/BS2) + BP4_Moderate = ВД. Предотвратява BS1 + BP4_Moderate (без друг BP) да попадне във VUS.
- Намаляваща промяна за Д: Д → ВД, когато BS1 + BP4_Moderate е единственото задействане на B2. Не може да създаде нови P/LP. Не може да премахне съществуващи ВД.
- Източник: Richards 2015 PMID:25741868 (Таблица 5 правило ii), Tavtigian 2020 PMID:32720330, Pejaver 2022 PMID:36413997.
- Поправка на граничен случай PM2 af_grpmax = 0.0 (Bug Bounty BB-006). Път на PM2 по af_grpmax: af_grpmax = 0.0 вече се третира като отсъстващ от контроли, последователно с пътя по глобалната честота (v3.21.2, CR-050). gnomAD записва варианти с AC=0 с af_grpmax=0.0 (не липсващ). При pm2_threshold=0.0 (RASopathy „отсъстващ от контроли“), 0.0 < 0.0 е невярно, блокирайки PM2.
- Засяга само VCEP гени с pm2_frequency_field=af_grpmax И pm2_threshold=0.0 (понастоящем гени за RASopathy). Неутрална/допълваща промяна: възстановява PM2 за некоректно блокирани варианти. Не може да премахне съществуващи P/LP.
- Източник: HELIX-CR-2026-050 (v3.21.2 global_af fix), HELIX-CR-2026-047 (v3.21.0 af_grpmax path), Richards 2015 PMID:25741868 (PM2 отсъстващ от контроли).
- Проекция за произход де ново при съставна хетерозиготност + хемизиготност (Bug Bounty BB-003). Защитата за compound_het_candidate е премахната от външния CASE на проекцията за произход де ново. Произход де ново и съставна хетерозиготност са съвместими: алел 1 де ново + алел 2 наследен от родител-носител = легитимна съставна хетерозиготност. PS2 (произход) и PM3 (биалелна конфигурация) са ортогонални типове доказателства.
- Поддръжка на хемизиготен генотип: rv.genotype IN (het, hom_alt) със защита за хромозома (X/chrX/Y/chrY). Хемизиготни мъже по X/Y коректно са допустими за проекция за произход де ново. Автозомен hom_alt е изключен.
- Документация на недостижими LP правила: LP1/LP1b/LP4/LP5/LP6 са анотирани като недостижими в контекст на произход де ново (ps_count+1 >= 1 е тавтологично, P правилата имат предимство). Запазени за пълнота на ACMG.
- Допълваща промяна: нов de_novo_candidate=true за VUS със съставна хетерозиготност и хемизиготен X/Y VUS. Без промяна на acmg_class (проекцията за произход де ново е само перспективна).
- Източник: Richards 2015 PMID:25741868 (дефиниции на PS2 и PM3), Abou Tayoun 2018 PMID:30192042.
- Поправка на правилото за комбиниране P8 (Bug Bounty BB-001). Правило за комбиниране P8: ps_count >= 1 И pm_count >= 4 е заменено с ps_count >= 1 И pm_count >= 1 И pp_count >= 4. Richards 2015 Таблица 5 правило (viii): >=1 силен И >=1 умерен И >=4 подкрепящи.
- Предишната реализация беше мъртъв код (погълнат от P6: ps>=1 И pm>=3) и кодираше несъществуващо правило. Проекция за произход де ново P8: същата поправка е приложена към CTE за проекция за произход де ново. Описанието на P8 е коригирано.
- Намаляваща/неутрална промяна: мъртвият код е заменен с коректно правило. Профилът 1S+1M+4PP е рядък при текущата реализация с 19 критерия (PS1 задейства приоритета на ClinVar преди оценяването по ACMG). Не се очакват промени в класификацията при симулация.
- Източник: Richards 2015 PMID:25741868 (Таблица 5 правило viii), Tavtigian 2018 PMID:29300386 (Байесова валидация: 4+2+4=10 точки = P).
- Таван за честота на алела при проекция за произход де ново + защита срещу конфликт след проекция (HELIX-CR-2026-071). Таван за честота на алела при произход де ново: CTE за проекция за произход де ново филтрира по честота на алела. Глобална честота > 0.001 ИЛИ af_grpmax > 0.001 блокира проекцията за произход де ново. PS2 (де ново) предполага, че вариантът не е наследен; честота > 0.001 означава ~150+ носители в gnomAD v4.1 (152 хил. генома). Конфигурационен параметър de_novo_af_ceiling (по подразбиране 0.001).
- Защита срещу конфликт след проекция: bs_count > 0 вече блокира проекцията за произход де ново безусловно. Предишната защита проверяваше конфликт преди проекция (pvs/ps/pm > 0 И bs > 0), пропускайки случаи, в които самата проекция на PS2 създава конфликта.
- Намаляваща промяна: премахва погрешни кандидати за произход де ново. Не може да създаде нови P/LP или нови кандидати за произход де ново.
- Клиничен повод: PEX2 интронен вариант HG2022_079 (честота на алела=0.0039, ложен de_novo_candidate=true).
- Разширение на защитата на LP2 само за изчислителни доказателства с PP3_splice_Strong (HELIX-CR-2026-067). Защитата на LP2 само за изчислителни доказателства (CR-042/064) е разширена: has_pp3_strong е заменено с (has_pp3_strong ИЛИ has_pp3_splice_strong). PP3_splice_Strong + PM2 без наблюдавано доказателство вече е блокиран, както PP3_Strong + PM2.
- Намаляваща промяна: от LP към VUS. Не може да създаде нови P/LP. Проекцията за произход де ново е непроменена (PS2 е наблюдавано доказателство, LP2 е легитимен).
- Клиничен повод: IRF1 p.Arg123Gly LP [PP3_splice_Strong,PM2] (симулация от CR-065/066, профил само с изчислителни доказателства).
- Взаимно изключване PP3 + PP3_splice (HELIX-CR-2026-066). PP3 (BayesDel, всички нива: Strong, Moderate, Supporting) е блокиран за варианти с двойна последица, при които последицата по VEP включва сплайс-област, донорен или акцепторен сплайс-сайт в допълнение към променен смисъл. ClinGen SVI (Walker 2023 Раздел 3.2): PP3 е единичен критерий. SpliceAI (PP3_splice) е по-специфичният инструмент, когато VEP потвърждава близост до сплайс-сайт.
- Симетрично с CR-065: CR-065 блокира PP3_splice за чисти варианти с променен смисъл (без етикет за сплайсинг от VEP). CR-066 блокира PP3 за варианти с променен смисъл С етикет за сплайсинг от VEP. Заедно: точно един PP3 път на вариант, никога и двата.
- Намаляваща промяна: PP3 премахнат от варианти с двойна последица, при които PP3_splice също се прилага. Не може да създаде нови P/LP. Клиничен повод: симулация от CR-065 IRF1 p.Arg123Gly от VUS към LP (PP3_Supporting + PP3_splice_Strong + PM2, двойно отчитане).
- Защита на PP3_splice за поносими варианти с променен смисъл (HELIX-CR-2026-065). PP3_splice (всички нива: Strong, Moderate, Supporting) е блокиран за чисти варианти с променен смисъл (без последица за сплайсинг по VEP), когато данни от BayesDel noAF са налични. ClinGen SVI (Walker 2023 Раздел 3.2): когато BayesDel показва поносим/неопределен вариант, а SpliceAI предсказва криптичен сплайсинг, доказателствата са противоречиви, не кумулативни.
- Включва защитата от CR-043 (v3.20.8) срещу двойно отчитане. Новата защита покрива както BayesDel >= 0.130 (случай от CR-043), така и BayesDel < 0.130 (случай от CR-065) в единично условие. Заобикалянето при липсващ BayesDel е запазено (SpliceAI като единствено изчислително доказателство). Заобикалянето за последица с променен смисъл + сплайсинг по VEP е запазено (VEP потвърждава близост до сплайс-сайт).
- Намаляваща промяна: PP3_splice премахнат от чисти варианти с променен смисъл с данни от BayesDel. Не може да създаде нови P/LP.
- Клиничен повод: PD2025_101 DICER1 c.5524A>G p.Ile1842Val LP [PP3_splice_Strong,PM2,PP2] спрямо VUS по експертен панел в ClinVar (3 звезди).
- Поправка на заобикалянето чрез PP2 при защитата на LP2 само за изчислителни доказателства (HELIX-CR-2026-064). Защитата на правилото за комбиниране LP2 (CR-042) е разширена: условието pp_count = 0 е заменено с (pp_count = 0 ИЛИ (pp_count > 0 И НЕ has_pp4 И НЕ has_pp5)). PP2 (нетолерантност на ниво ген) вече не заобикаля защитата за LP само с изчислителни доказателства при PP3_Strong+PM2. PP4 (съвпадение по HPO, наблюдавано) и PP5 (ClinVar с 1 звезда, наблюдавано) все още легитимно заместват защитата.
- Намаляваща промяна: от LP към VUS. Не може да създаде нови P/LP. Проекцията за произход де ново е непроменена: PS2 + PP3_Strong = ps_count >= 2 → P5.
- Клиничен повод: PD2025_002 MEN1 p.Arg115His LP [PP3_Strong,PM2,PP2] спрямо VUS по ClinVar (2 звезди, 70 варианта P/LP с променен смисъл в гена).
- Защита на LP за хетерозиготна загуба на функция при гени само с АР/биалелна загуба на функция (HELIX-CR-2026-063). Всички LP правила за комбиниране (LP1–LP6) са блокирани за хетерозиготни варианти със загуба на функция (въздействие HIGH) в гени само с АР/биалелна загуба на функция без партньор за съставна хетерозиготност. Хетерозиготна загуба на функция в ген само с АР = състояние на носителство, не патогенно събитие. Richards 2015 Таблица 3: PVS1 предполага патогенен контекст.
- Логика на защитата: булев ar_biallelic_het_lof_guard. Истина, когато генотип=хетерозиготен, въздействие=HIGH, compound_het_candidate=невярно/липсващо И генът е в gene_disease_mechanism (загуба на функция, биалелен, окончателно/силно/умерено) ИЛИ (само АР по Orphanet И загуба на функция по gene_disease_mechanism). P правилата НЕ са блокирани: P1 с PS1 по ClinVar е легитимно заместване.
- Проекция за произход де ново: блокирана от защитата. pLI~0 + LOEUF>1 = хетерозиготната загуба на функция е толерирана в gnomAD. Хетерозиготна загуба на функция де ново не е информативна за АД механизъм.
- Взаимодействие: ортогонално спрямо CR-061 (варианти с променен смисъл), CR-062 (изчислителни). Намаляваща промяна: от LP към VUS. Не може да създаде нови P/LP.
- Клиничен повод: PD2025_084 AMACR c.857del LP [PVS1_Strong,PM2] спрямо VUS по ClinVar (2 звезди). AMACR: pLI=0.000001, LOEUF=1.108, само АР по Orphanet, биалелна загуба на функция с окончателна оценка по G2P.
- Защита на LP само за изчислителни доказателства при LP4/LP5/LP6 (HELIX-CR-2026-062). Правилата за комбиниране LP4/LP5/LP6 са блокирани, когато ВСИЧКИ патогенни критерии са изчислителни или базирани на анотация: PM1 (домейн), PM2 (честота), PP2 (нетолерантност на ниво ген), PP3 (BayesDel, всяко ниво), PP3_splice (SpliceAI, всяко ниво). Изисква се поне един наблюдаван/клиничен критерий: PS1 (наблюдаван по ClinVar), PM3 (съставна хетерозиготност), PM4 (промяна със запазена рамка), PP4 (фенотипно съвпадение) или PP5 (ClinVar с ниска увереност).
- Проекция за произход де ново: LP4/LP5/LP6 НЕ са ограничени от тази защита. PS2 (де ново) е наблюдавано доказателство - ако бъде потвърдено, LP е легитимен дори само с изчислителни умерени критерии.
- Намаляваща промяна: не може да създаде нови P/LP. От LP към VUS, когато целият профил на доказателствата е изчислителен. Нулево въздействие върху LP, базиран на PVS1, LP от PP3_splice, LP от приоритета на ClinVar, LP от съставна хетерозиготност или LP от PM4.
- Клиничен повод: PD2025_106 JAG1 p.Gly309Arg LP [PM1,PM2,PP2,PP3_Supporting] спрямо VUS по ClinVar (2 звезди).
- Защита на LP за моноалелен вариант с променен смисъл при АР/биалелни гени със загуба на функция (HELIX-CR-2026-061). PP2 е блокиран за хетерозиготен вариант с променен смисъл в АР/биалелни гени със загуба на функция без документиран механизъм на заболяване чрез промяна на смисъла. Richards 2015 Таблица 3: PP2 изисква „вариантите с променен смисъл да са чест механизъм на заболяване“. АР гени със загуба на функция без патогенни/вероятно патогенни варианти с променен смисъл в ClinVar (clinvar_missense_genes) не удовлетворяват тази предпоставка.
- Правилата за комбиниране LP4/LP5/LP6 са блокирани (ar_biallelic_missense_guard) за хетерозиготни варианти с променен смисъл в АР/биалелни гени със загуба на функция без партньор за съставна хетерозиготност и без доказателства за варианти с променен смисъл P/LP по ClinVar.
- Проекция за произход де ново: LP4/LP5/LP6 са блокирани от същата защита. LP2 (PS2 + PM) умишлено НЕ е блокиран - произходът де ново е пряко фенотипно наблюдение, не изчислително предсказание.
- Намаляваща промяна: не може да създаде нови P/LP. ~44 LP → VUS (хетерозиготни варианти с променен смисъл в АР/биалелни гени със загуба на функция). Нулево въздействие върху LP, базиран на PVS1, LP от PP3_splice, LP от приоритета на ClinVar или кандидати за съставна хетерозиготност.
- Клиничен повод: PD2025_127 ABCA2 p.Arg1064Cys LP [PM1,PM2,PP3_Moderate,PP2] спрямо VUS по ClinVar (2 звезди, множество подаващи, без противоречия).
- Подкрепящо доброкачествено доказателство BP4_splice за неканоничен сплайсинг (HELIX-CR-2026-060). Подкрепящо доброкачествено доказателство за варианти в неканонични сплайс-области с оценка по SpliceAI <= 0.1. Покрива последиците splice_donor_region, splice_donor_5th_base, splice_acceptor_5th_base, splice_region и splice_polypyrimidine_tract. Изключва синонимни (BP7 ги обработва) и варианти с променен смисъл (BP4 по BayesDel ги обработва).
- Праг по SpliceAI <= 0.1: последователен със защитата за синонимни при BP7. Jaganathan 2019 PMID:30661751, de la Hoya 2022 PMID:35202600.
- Защита за PVS1: НЕ pvs1_cond (преди разделянето, покрива и пълно, и за последен екзон). Същата защита като пътищата PP3_splice. Без двойно отчитане на доказателства за сплайсинг и загуба на функция. Низ с критерии: BP4_splice (подкрепящо доброкачествено).
- Намаляваща промяна: добавя само доброкачествено доказателство. Не може да създаде нови P/LP. VUS с BS1/BS2 + BP4_splice = ВД (правило LB1). VUS без силно доброкачествено остава VUS (1 BP е недостатъчен за LB2).
- Клиничен повод: PD2025_087 HNF4A c.426+4C>T (splice_donor_region, SpliceAI=0.0, VUS без критерии). Отбелязан от генетик Д. Манева.
- Защита за валидация на партньора по ClinVar при PM3 (HELIX-CR-2026-058). Само compound_het_candidate = true вече не удовлетворява PM3. Партньорът трябва да е патогенен или вероятно патогенен по ClinVar (clinical_significance съдържа Pathogenic% ИЛИ Likely_pathogenic%, НЕ съдържа %Conflicting%) с брой звезди за преглед >= ps1_min_stars (понастоящем 2). Richards 2015 Таблица 3: открит в транс-конфигурация с патогенен вариант - патогенността на партньора е изрична.
- Защита само по ClinVar (без зависимост от acmg_class): избягва кръгова препратка, при която класификацията на партньора зависи от PM3, който зависи от класификацията на партньора. Анотацията от ClinVar е външна и неизменяема.
- Намаляваща промяна: PM3 може само да бъде премахнат, не добавен. 241 LP → VUS се очакват (PM3 беше решаващ). 5 LP непроменени (валидиран партньор). Проекцията за произход де ново наследява промяната на PM3 чрез pm3_cond.
- Клиничен повод: HG2022_037 F5 p.Met1874Thr LP [PM2,PM3,PP3_Moderate,BP2] спрямо VUS по ClinVar (2 звезди). Партньор: Фактор V Лайден (p.Arg534Gln, честота на алела=2,14%, ClinVar лекарствен отговор 3 звезди). PM3 некоректно се задейства без валидация на патогенността на партньора.
- Въздействие: 188 сесии, 52 929 PM3 варианта, 241 LP → VUS, 0 нови P/LP.
- BP_regional Фаза 3 - популационна толерантност към загуба на функция по gnomAD като подкрепящо доброкачествено доказателство (HELIX-CR-2026-057 Фаза 3). Подкрепящо доброкачествено (bp_count) за варианти с въздействие HIGH извън кодиращата област на MANE, където gnomAD демонстрира регионална толерантност към загуба на функция при здрави индивиди. Надгражда информационния сигнал от v3.24.0.
- АД гените са изключени - толерантността към хетерозиготна загуба на функция при АД е различен клиничен аргумент. Кандидатите за съставна хетерозиготност са изключени - те могат да допринесат за биалелна загуба на функция.
- Условия: gls.gene_symbol НЕ Е ЛИПСВАЩ, позиция извън кодиращата област на MANE, въздействие=HIGH, НЕ compound_het_candidate, начин на унаследяване Е ЛИПСВАЩ ИЛИ В (АР, АД/АР, Х-свързан). Автозомен: max_nhomalt >= 2. Х-свързан: max_ac_hemi >= 2.
- Маркер в низа с критерии: BP_regional[gnomAD_LoF].
- Сигнал за популационна толерантност към загуба на функция по gnomAD (HELIX-CR-2026-057 Фаза 1). Булев gnomad_lof_tolerant: генът има варианти с високо въздействие и загуба на функция с хомозиготи/хемизиготи > 0 извън кодиращата област на MANE в геномите на gnomAD. Фаза 1 е само информационна, без промяна на ACMG критерии.
- Референтни данни: заредена таблица gnomad_lof_tolerant_gene_summary. Агрегира max_nhomalt, max_ac_hemi, брой варианти със загуба на функция по ген с примерен вариант за одитна следа.
- Активира се чрез mt.gene_symbol НЕ Е ЛИПСВАЩ (задължителен позиционен контекст) и позиция извън кодиращата област на MANE.
- Фаза 2 (CR-057 Фаза 3, v3.25.0): сигналът gnomad_lof_tolerant се превръща в подкрепящ доброкачествен критерий BP_regional.
- PVS1: Защита, съобразена с експресията, чрез данни за pext от gnomAD v4.1 (GTEx v10, GRCh38, 49 тъкани). Стойността на max_tissue_pext на ниво екзон модулира прилагането на PVS1 (HELIX-CR-2026-056, Cummings et al. 2020 PMID:32461655). Три нива: max_tissue_pext >= 0.9 = PVS1 Very Strong (непроменен), 0.1–0.9 = PVS1_Strong[pext] (намален от Very Strong до Strong), < 0.1 = PVS1 блокиран (екзонът не се експресира). Липсваща pext стойност = Very Strong (консервативен резервен подход). PM4 получава двоична pext защита (блокиран при < 0.1).
- PVS1: 189 856 записа за екзони в 18 923 MANE Select гена, заредени от TSV с pext стойности на ниво база от gnomAD v4.1. Разпределение: 56,3% пълни (>= 0.9), 42,5% намалени (0.1–0.9), 1,2% блокирани (< 0.1). Използва max_tissue_pext (максимум от 49 тъкани по GTEx v10), за да се избегнат погрешни отрицателни при тъканно-специфични гени.
- PVS1: Четими анотации в acmg_criteria („[PVS1 блокиран: ниска експресия на екзон (pext X.XX)]“, „[PVS1 намален: частична експресия на екзон (pext X.XX)]“) и пояснителни бележки (пълно изречение с име на ген, праг, източник).
- Референтни бази: gnomAD pext (v4.1, GTEx v10) и MANE Select транскрипти (v1.4) са добавени като референтни източници на данни.
- Научна основа: Cummings 2020 демонстрира, че анотацията, базирана на експресия, селективно филтрира 22,8% от погрешно анотирани варианти с предполагаема загуба на функция, като премахва по-малко от 4% от истинските патогенни варианти.
- PVS1: Позиционна защита по MANE Select (HELIX-CR-2026-055, Abou Tayoun 2018 PMID:30192042). Варианти извън кодиращата област на MANE Select/Plus Clinical не получават PVS1 или PM4. Адресира погрешно прилагане на PVS1 върху варианти, анотирани от VEP срещу неканонични транскрипти, които се простират извън каноничната кодираща последователност.
- PVS1: 19 354 MANE транскрипта (19 288 Select + 66 Plus Clinical) с координати на кодиращата област, заредени от MANE GFF3 v1.4. LEFT JOIN с GROUP BY предотвратява дублиране на редове за 66 гена и с двата типа Select и Plus Clinical транскрипти.
- PVS1: Вградени защити, безопасни при липсващи стойности, на 6 места (pvs_count, ps_count/pvs1_last_exon, pm_count/pm4, has_pvs1_full, has_pvs1_last_exon, has_pm4). Липсващи MANE данни = PVS1 приложен (консервативен резервен подход за гени, все още не включени в MANE).
- Низ с критерии: маркер [PVS1_BLOCKED:outside_MANE_CDS] се добавя за варианти с въздействие HIGH извън кодиращата област на MANE. Пояснителни бележки: PVS1_BLOCKED:outside_MANE_CDS(ген,mane_ген) за одитна следа.
- Клиничен повод: HG2022_057 FANCB chrX:14797196 p.Gln864Ter класифициран като LP (PVS1+PM2) срещу неканоничен транскрипт ENST00000696353. Позицията е 46 kb нагоре по веригата от кодиращата област на MANE Select (14 843 567–14 865 510). Прекласифициран на VUS (само PM2).
- CLCN1 премахнат от AR_LOF_GENES (HELIX-CR-2026-053). Вродената миотония има и АД (Томсен), и АР (Бекер) форми. Хетерозиготната загуба на функция може да причини АД болест на Томсен. CLCN1 получава АД/АР чрез двойна проверка по HPO.
- Анотация Фаза 7.5: откриване на двойно унаследяване по HPO (HELIX-CR-2026-051). Гени и с HP:0000006 (АД), и с HP:0000007 (АР), потвърдени чрез биалелен механизъм в gene_disease_mechanism, вече получават АД/АР вместо АД. 312 гена с подобрена анотация.
- CYP11A1 added to AR_LOF_GENES. Congenital adrenal insufficiency, AR. OMIM #613743.
- Подравняване на честотното поле при PM2 за VCEP прагове по филтрирана честота на алела (HELIX-CR-2026-047). VCEP гени с pm2_frequency_field=af_grpmax вече сравняват PM2 спрямо af_grpmax вместо глобалната честота. Тясно място при липсващи данни от ниво K1: af_grpmax липсва + глобална честота не липсва = PM2 не е удовлетворен.
- Одитна следа в низа с критерии при PM2: маркери PM2[af_grpmax] и PM2_Supporting[af_grpmax].
- BP1: защита за механизъм чрез промяна на смисъла на ниво референция (HELIX-CR-2026-044). BP1 е блокиран, когато генът е в refdb.clinvar_missense_genes (>= 2 патогенни/вероятно патогенни варианти с променен смисъл по ClinVar при 2+ звезди). Разширява защитата по ClinVar на ниво сесия с проверка на ниво референция.
- Защита срещу двойно отчитане на PP3_splice за варианти с променен смисъл (HELIX-CR-2026-043). PP3_splice е блокиран, когато вариантът вече получава PP3 от пътя за варианти с променен смисъл по BayesDel. ClinGen SVI: PP3 е единичен критерий.
- BP1: защита за гени с придобиване на функция или доминантно-негативен механизъм (HELIX-CR-2026-039v2). BP1 е блокиран в гени с придобиване на функция или доминантно-негативен механизъм, при които скъсяващите варианти не причиняват заболяване чрез загуба на функция. PLIN1 добавен в GOF_AD_GENES (доминантно-негативен механизъм, FPLD4).
- PVS1/PM3: защита за гени с двоен механизъм (HELIX-CR-2026-037). Изгледът gof_genes_exclusive изключва 55 гена с двоен механизъм от защитата за придобиване на функция, възстановявайки PVS1/PM3 за АР пътя на загуба на функция.
- PM3: изключване на гени с придобиване на функция или доминантно-негативен механизъм (HELIX-CR-2026-036). Съставната хетерозиготност в чисти гени с придобиване на функция или доминантно-негативен механизъм вече не удовлетворява PM3. PM3 предполага автозомно-рецесивен механизъм.
- Проверка за асоциация със заболяване: таблицата gene_disease_mechanism е добавена като 7-ми източник в pvs1_disease_gate и gene_has_disease_association (HELIX-CR-2026-026). 256 гена в gene_disease_mechanism (G2P 225, GoFCards 35, ръчни 2) не бяха покрити от съществуващите 6 източника за проверка за заболяване. Филтър за увереност: само окончателни/силни/умерени (предсказани са изключени по указание на техническия директор). Клиничен повод: SNRPN c.-391+1_-391+2insGA ложен VUS след поправката за хаплонедостатъчност във v3.18.1.
- Проверка за асоциация със заболяване: haploinsufficiency_score НЕ Е ЛИПСВАЩ е заменено с В (2, 3, 30) в pvs1_disease_gate и gene_has_disease_association (HELIX-CR-2026-025). HI=0 (без доказателства), HI=1 (малко доказателства), HI=40 (чувствителност към дозата малко вероятна) вече не удовлетворяват проверката за заболяване. 475 гена губят погрешна асоциация със заболяване, 117 без друг източник за заболяване. Клиничен повод: SLC22A18 c.-133+2T>C ложен LP в ген без Менделово заболяване.
- Защита на PVS1 за гени с придобиване на функция или доминантно-негативен механизъм: изгледът gof_genes_g2p (198 гена) е заменен от обединения изглед gof_genes_unified (347 гена) като първичен източник за изключване по PVS1 за придобиване на функция (HELIX-REF-003 Фаза 2A). gof_genes_unified черпи от 3 източника: G2P (199 гена), GoFCards (179 гена), ръчен подбор (27 гена). Гени с двоен механизъм са коректно изключени. Python константата GOF_AD_GENES е запазена като резерв.
- Референтна база: таблица gene_disease_mechanism, създадена в reference_db (2617 записа). Унифицирана схема за данни за молекулярен механизъм от G2P, GoFCards и ръчен подбор. Колони: gene_symbol, disease_id, disease_name, механизъм (загуба на функция/придобиване на функция/доминантно-негативен/усилена експресия), увереност, източник, алелно изискване, PMID, дата на подбор, експерт, последен преглед, бележки.
- Референтна база: интегриран GoFCards Release 1.0 (579 гена, 3161 подбрани варианта с придобиване на функция). Праг за агрегация на ниво ген: 3+ варианта, оценка >= 2.0, поне 1 вариант с доказателство от животински или клетъчен модел = увереност "силна". 217 гена се квалифицират.
- Референтна база: интегриран пълен TSV за чувствителност към дозата по ClinGen (1626 гена, 23 колони). Замества наследената таблица с 3 колони за ClinGen. Обратно съвместима таблица за ClinGen е пресъздадена от пълните данни.
- Източник: GoFCards PMID:39578693, ClinGen clinicalgenome.org, HELIX-REF-003.
- PVS1: 12 АД гена с придобиване на функция, доминантно-негативен или усилен експресионен механизъм са добавени в GOF_AD_GENES (HELIX-REF-003 Фаза 2B). Системен анализ на пропуски: 28 АД гена зависят САМО от пътя по ClinGen АД с окончателна оценка за PVS1, без проверка за механизъм. 13 са идентифицирани като високорискови (установен механизъм, различен от загуба на функция). TRAF7 е отложен (недостатъчни функционални доказателства за зародишна линия).
- Добавени гени: CALM2 (доминантно-негативна калмодулинопатия), CALM3 (доминантно-негативна калмодулинопатия), DNAJB6 (доминантно-негативна миофибриларна миопатия), GJB6 (доминантно-негативна глухота, ClinGen АР=отхвърлен), GREM1 (усилена експресия, регулаторен механизъм), HSPB8 (токсична придобиване на функция, CMT2L), INF2 (доминантно-негативен, ФСГС5), NEFL (доминантно-негативен неврофиламентен CMT), PRKAG2 (придобиване на функция, активация на AMPK), SKI (доминантно-негативен, синдром на Шпринцен–Голдберг), TNNC1 (придобиване на функция, чувствителност към Ca2+, ХКМ), TUBB3 (доминантно-негативен, микротубули, CFEOM3A).
- Кръстосана проверка с LoGoFunc (предсказания на ниво вариант за придобита/загуба на функция), GoFCards (подбрани варианти с придобиване на функция), чувствителност към дозата по ClinGen (сигнал HI=0) и данни за механизъм от G2P.
- PVS1: ANKRD26 и C1QTNF5 са добавени в GOF_AD_GENES (HELIX-CR-2026-024). ANKRD26: тромбоцитопения 2, механизъм на усилена експресия - мутации в 5′-нетранслируемата област нарушават заглушаването от RUNX1/FLI1. Чувствителността към дозата по ClinGen изрично посочва „придобиване на функция, а не хаплонедостатъчност“. C1QTNF5: късно начало на ретинална дегенерация, доминантно-негативен механизъм - мутантният белтък дестабилизира дивия тип при съвместна експресия в домейна gC1q.
- Клиничен повод: PD2025_095 ANKRD26 chr10:27044191 класифициран като P [PVS1,PM2,PM3], трябва да е VUS. C1QTNF5 chr11:119339479 получи PVS1_Strong за изместване на рамката въпреки че всички известни патогенни варианти са с променен смисъл.
- PVS1: интеграция на молекулярния механизъм от G2P (HELIX-CR-2026-023). Базата данни DECIPHER Gene2Phenotype (G2P) вече осигурява първичната защита за придобиване на функция/доминантно-негативен механизъм при PVS1. Изгледът gof_genes_g2p съдържа 198 чисти моноалелни гена с придобиване на функция или доминантно-негативен механизъм, при които PVS1 е блокиран. G2P се заявява при класификация чрез прикачване на reference_db.
- PVS1: GOF_AD_GENES е намален от 36 до 14 резервни гена (гени, отсъстващи от G2P: 6 за невродегенерация/токсична агрегация, 3 соматични/неоморфни, 5 отсъстващи от G2P издание 2026-02-28). PRSS1 е добавен в резерва (придобиване на функция чрез автоактивация на трипсиноген, клиничен повод PD2025_090).
- PVS1: GNAS е премахнат от GOF_AD_GENES (двоен механизъм: синдром на Макюн–Олбрайт = придобиване на функция, псевдохипопаратиреоидизъм 1A = загуба на функция). Изгледът по G2P коректно изключва GNAS. Вариантите на GNAS със загуба на функция вече получават PVS1.
- PVS1: 49 гена с двоен механизъм (SCN5A, LMNA, KCNH2, KCNQ1, FGFR1 и др.) са изключени от изгледа за придобиване на функция, запазвайки PVS1 за легитимни фенотипи със загуба на функция.
- PVS1: филтър за увереност по G2P: включени са само окончателни, силни и умерени. Ограничената увереност е изключена, за да не се блокира PVS1 при слаби доказателства за придобиване на функция.
- PVS1: ред на защитите: изглед по G2P (първичен) → GOF_AD_GENES (резерв). Идентичен модел с refdb.ar_lof_genes_clingen и refdb.disease_associated_genes_clingen.
- DECIPHER G2P: данни за молекулярен механизъм (таблица g2p_gene_mechanism, 2372 записа) са добавени в reference_db наред със съществуващите данни за обогатяване по HPO (v3.12.0).
- Зареждащ скрипт: scripts/load_g2p_mechanism.py с режим на сухо пускане, флагове за принудително изпълнение и 9-точкова валидация (общ брой записи, разпределение по механизъм, брой в изгледа, изключване на двоен механизъм, точкови проверки).
- Намаляваща промяна: може само да премахне PVS1 от гени с придобиване на функция или доминантно-негативен механизъм. Не може да създаде погрешни P/LP.
- Клиничен повод: PD2025_090 PRSS1 p.Gly177Ter (поява на стоп-кодон). Ген с придобиване на функция, PVS1 е научно некоректен. BA1 защитава в конкретния случай (честота на алела 41%), но редки скъсяващи варианти на PRSS1 без BA1 биха могли некоректно да достигнат LP[PVS1,PM2].
- Източник: Abou Tayoun 2018 PMID:30192042, Josephs 2023 PMID:37884986, HELIX-CR-2026-023.
- PVS1: изключване на АД гени с придобиване на функция (HELIX-CR-2026-022). Подбран списък GOF_AD_GENES (36 гена) блокира PVS1 за автозомно-доминантни гени, при които механизмът на заболяване е придобиване на функция, доминантно-негативен или токсична агрегация. Дърво за решения по ClinGen PVS1, Възел 1: „Дали загубата на функция е известен механизъм на заболяване?“ - ако НЕ, PVS1 не е приложим.
- PVS1: категории в GOF_AD_GENES: път RAS/MAPK (12 гена), рецепторни тирозин кинази (10), PI3K/AKT/mTOR (2), ГТФази (3), метаболитни ензими (2), кинази (2), невродегенерация (6). Всеки ген е документиран с PMID за механизъм на придобиване на функция.
- PVS1: АД гени с окончателна или силна оценка по ClinGen запазват достъп до PVS1 дори ако са в GOF_AD_GENES - VCEP и валидността на връзката ген–заболяване по ClinGen имат предимство.
- Клиничен повод: PD2025_082 RAC1 p.Val14SerfsTer4 (изместване на рамката в ген с придобиване на функция). Несъответствие при SOD1 в същата сесия.
- Източник: Abou Tayoun 2018 PMID:30192042, HELIX-CR-2026-022.
- LP класификация: проверка за асоциация със заболяване за LP правила LP4, LP5, LP6 (HELIX-CR-2026-021). LP правилата, които разчитат само на критерии с умерена и подкрепяща сила, вече изискват установена асоциация със заболяване от поне един от пет източника (същите като проверките за PVS1 и PP3_Strong).
- LP4 (>=3 PM), LP5 (2 PM + >=2 PP), LP6 (1 PM + >=4 PP): тези правила могат да бъдат удовлетворени от PM1+PM2+PM4 или подобни комбинации без каквото и да е доказателство за връзка ген–заболяване. Защитата предотвратява LP класификация в гени без известен Менделов механизъм на заболяване.
- LP1, LP2, LP3 не са ограничени: те изискват PVS или PS критерии, които вече имат собствени проверки за асоциация със заболяване.
- Намаляваща промяна: може само да намали LP до VUS, не може да повиши.
- PVS1: АД гени с окончателна или силна оценка по ClinGen заобикалят проверката за нетолерантност по pLI/LOEUF. Гени с оценка за валидност на връзката ген–заболяване по ClinGen от окончателна или силна за автозомно-доминантно унаследяване вече се квалифицират за PVS1 независимо от популационните метрики за нетолерантност.
- PVS1: адресира гени като TUBB1 (pLI близо до 0, LOEUF=1.586) с окончателна АД оценка по ClinGen, които бяха изключени от PVS1 от популационната проверка за нетолерантност.
- Интеграция на валидността на връзката ген–заболяване по ClinGen: референтни таблици ar_lof_genes_clingen и disease_associated_genes_clingen са добавени в reference_db. Замества Python константи в паметта за списъка на АР гени със загуба на функция и проверките за асоциация със заболяване.
- Заобикалянето за АР гени при PVS1 вече заявява refdb.ar_lof_genes_clingen при класификация вместо Python константата AR_LOF_GENES.
- Проверката за асоциация със заболяване вече заявява refdb.disease_associated_genes_clingen за PVS1, PP3_Strong, LP проверките за заболяване и проверката за приоритет на ClinVar.
- Брой референтни бази: 14 (преди това 13).
- PM1: критичните функционални домейни са мигрирани от Python константа (CRITICAL_PFAM_DOMAINS) към референтна таблица в базата данни (refdb.interpro_pfam_domains). HELIX-CR-2026-012.
- PM1: пълният каталог на InterPro Pfam (27 481 записа) е зареден в reference_db. 49 домейна са маркирани като критични (is_critical=true) в 14 категории.
- PM1: подход с предварително изграждане - критичните идентификатори се зареждат от референтната база при класификация, генерирайки OR LIKE клаузи в Python. Нулева регресия на производителността спрямо v3.14.0.
- PM1: добавянето на нов критичен домейн вече е актуализация в базата данни, а не промяна на код + повторно изграждане + внедряване.
- InterPro / Pfam е добавен като 13-та референтна база.
- Зареждащ скрипт: scripts/load_interpro_pfam.py с извличане от InterPro API, JSON кеш за работа без връзка и валидация с прекъсване при грешка.
- Източник: HELIX-CR-2026-012.
- PM1: CRITICAL_PFAM_DOMAINS е преобразуван от кратки имена по Pfam към верифицирани идентификатори по InterPro Pfam (HELIX-CR-2026-011). Анотацията от VEP записва данните за домейни като Pfam:PFxxxxx идентификатори, но SQL заявката за PM1 търсеше кратки имена (RyR, Pkinase, Ion_trans). Резултат: 0 легитимни PM1 прилагания от въвеждането на подбрания списък. Поправка: всички 49 домейна вече използват верифицирани идентификатори.
- PM1: премахнати Rho (покрит от PF00071 суперфамилия Ras, VEP потвърждава RAC1 анотиран с PF00071) и Peptidase_S1 (покрит от PF00089 Trypsin, VEP потвърждава F10 анотиран с PF00089).
- PM1: коригирани идентификатори - Dynamin_N: PF01031 (Dynamin_M) коригиран на PF00350 (Dynamin_N). PH: PF00168 (домейн C2) коригиран на PF00169 (домейн PH). FBN_EGF: съпоставен с PF00008 (EGF-подобен домейн).
- PM1: всички 49 идентификатора са верифицирани срещу InterPro REST API (ebi.ac.uk/interpro) на 2026-03-16. Покритието на домейните е валидирано срещу пациентски VCF данни (RYR1 PF01365, KRAS PF00071, KCNH2 PF00520, CDH23 PF00028, MYO7A PF00063, COL1A1 PF01391, CFTR PF00005, EGFR PF07714).
- PM1: валидация след поправката за HG2023_206: броят PM1 нараства от 2 (погрешно положителни) до 1139 (легитимни). RYR1 c.6635T>C коректно получава PM1. Ложните положителни за CRYGD са елиминирани. Нулеви промени в Д/ВД класификациите.
- Клиничен повод: HG2023_206 RYR1 c.6635T>C (p.Val2212Ala) в домейн RyR (Pfam:PF01365) класифициран като VUS [PM2,PP3_Supporting] без PM1. По CG класифициран като LP. PM1 вече приложен: VUS [PM1,PM2,PP3_Supporting].
- Източник: HELIX-CR-2026-011, Richards et al. 2015 PMID:25741868, указания на ClinGen SVI за PM1.
- PVS1: доказателство за варианти със загуба на функция в ClinVar е добавено като пети път в проверката за нетолерантност (HELIX-CR-2026-010). Малки автозомно-доминантни гени с патогенни/вероятно патогенни варианти със загуба на функция в ClinVar (2+ звезди за преглед), но с неинформативна нетолерантност по gnomAD (pLI < 0.9, LOEUF >= 0.35, HI != 3) вече се квалифицират за PVS1 чрез подбрания списък CLINVAR_LOF_AD_GENES.
- gene_has_disease_association: CLINVAR_LOF_AD_GENES е добавен като шести източник в проверката за асоциация със заболяване.
- Клиничен повод: GCM2 p.Arg131Ter (поява на стоп-кодон) в PD2025_098. GCM2 е АД ген с 5 екзона за фамилен хипопаратиреоидизъм с патогенен p.Tyr136Ter по ClinVar (2 звезди), но pLI=0.0, LOEUF=1.205, HI=липсващ. Сега LP [PVS1,PM2].
- Източник: Abou Tayoun 2018 PMID:30192042, HELIX-CR-2026-010.
- PP3/BP4: защита за последица с променен смисъл (HELIX-CR-2026-009). Пътят на PP3 по BayesDel (Strong/Moderate/Supporting) и пътят на BP4 по BayesDel (Moderate/Supporting) вече изискват последица = missense_variant. BayesDel_noAF е калибриран изключително за варианти с променен смисъл (Pejaver et al. 2022).
- Клиничен повод: GCM2 p.Arg131Ter (поява на стоп-кодон) в PD2025_098 получи PP3_Strong (BayesDel=0.66) + PM2 = LP. Коректно: само PM2 = VUS. 2 варианта с последица, различна от променен смисъл, с ложен PP3_Strong са елиминирани.
- Намаляваща промяна: може само да намали (от LP към VUS), не може да повиши. PP3_splice (SpliceAI) не е засегнат.
- Източник: Pejaver 2022 PMID:36413997, Walker 2023 PMID:37352859, HELIX-CR-2026-009.
- HELIX-REF-001: процес за обогатяване на HPO от множество източници. Анотацията по HPO е разширена от единичен източник (HPO Consortium, 5173 гена, 320 хил. записа) до обогатен изглед от множество източници (6 източника, 5688 гена, 927 хил. записа, +10% покритие на гени).
- Източници за HPO: HPO Consortium (първичен), Orphanet съпоставяне заболяване–HPO чрез Orphadata XML (3176 гена с данни за честота), DECIPHER G2P от 7 клинични панела (2125 гена), Monarch Initiative (4791 гена), верижно съпоставяне ClinVar–MedGen от P/LP варианти (5258 гена) и ръчен клиничен подбор за гени при чести заболявания.
- Дълбочина на обогатяване: 3292 съществуващи гена получиха допълнителни HPO термини. 515 нетно нови гена са добавени. 1505 гена са покрити от всички 5 автоматизирани източника.
- Приоритетно подреждане на източниците: Orphanet > G2P > HPO Consortium > Monarch > ClinVar-MedGen. Записи с ниска увереност са филтрирани от клиничния изглед.
- Критерият PP4 се оценява спрямо обогатения набор от HPO термини. Без промени в логиката на ACMG критериите.
- Валидация на целостта на данните: 0 липсващи стойности, 0 невалидни HPO идентификатора, 0 дублирани първични ключове в 926 930 записа.
- PVS1: варианти в неканонични сплайс-сайтове са изключени от прилагане на PVS1. Термините за последица по VEP splice_donor_5th_base_variant (позиция +5), splice_donor_region_variant (позиции от +3 до +8) и splice_acceptor_5th_base_variant (позиция -5 на акцептора) вече блокират PVS1. Дървото за решения по ClinGen PVS1 (Abou Tayoun et al. 2018) посочва само канонични +/-1,2 сплайс-сайтове. Варианти в разширена сплайс-област запазват достъп до PP3_splice (SpliceAI >= 0.2) на ниво подкрепящо доказателство.
- Клиничен повод: PDE6B c.1401+4_1401+48del в PD2025_061 - VUS спрямо доброкачествен по ClinVar (2 звезди). VEP анотира като splice_donor_5th_base_variant. PVS1 създаваше погрешно противоречиво доказателство (PVS1 срещу BS1+BS2+BP6 = VUS).
- Въздействие: 2 от 18 варианта с PVS1 при splice_donor са засегнати в PD2025_061. 0 P/LP варианта са засегнати. Намаляваща промяна (не може да създаде погрешни P/LP).
- Низовете в дневника вече използват константата CLASSIFIER_VERSION вместо твърдо зададена версия.
- Източник: HELIX-CR-2026-008, Abou Tayoun 2018 PMID:30192042.
- PVS1: NMD_transcript_variant вече не блокира PVS1. Анотацията NMD_transcript_variant от VEP означава, че транскриптът ПОДЛЕЖИ на безсмислено-опосредствено разграждане, което е допълнително доказателство ЗА загуба на функция, не срещу нея. Изключването вече е насочено към NMD_escaping_variant (транскрипти, които избягват разграждането - скъсеният белтък се експресира и може да запази частична функция).
- Предишно поведение: frameshift_variant,NMD_transcript_variant → PVS1 блокиран. Ново поведение: frameshift_variant,NMD_transcript_variant → PVS1 се прилага. frameshift_variant,NMD_escaping_variant → PVS1 блокиран (коректно).
- Клиничен повод: повторен преглед на HG2022_057 (изместване на рамката в KCNN2).
- Източник: документация на VEP (Ensembl), Abou Tayoun et al. 2018 PMID:30192042.
- Проекция за произход де ново (PS2): перспективно изчисление дали добавянето на PS2 (потвърден произход де ново, Strong) би повишило VUS до LP или P. Идентифицира варианти, при които потвърждението чрез трио има най-голямо клинично значение.
- Изключва: варианти, различни от VUS, варианти, различни от хетерозиготни, с активен BA1, кандидати за съставна хетерозиготност (биологично несъвместими с произход де ново) и варианти с противоречиви доказателства.
- Защита за минимални доказателства (v3.11.2): само PM2 е недостатъчен за кандидатура за произход де ново - изисква се поне един допълнителен патогенен критерий извън PM2.
- Проекцията за произход де ново е само информационна - не променя текущата ACMG класификация. Тя отбелязва варианти, при които тестване на родителите би разрешило статуса на VUS.
- CTE disease_genes_clinvar: добавен филтър за брой звезди за преглед >= 2. Споделеното CTE, което осигурява доказателство за асоциация със заболяване на ниво ген по ClinVar (Източник 1 от 5 в проверката за асоциация със заболяване) преди това включваше всички P/LP гени по ClinVar без минимум за звезди. Това създаваше кръгова препратка: подаване по ClinVar с 1 звезда P/LP едновременно задействаше приоритета на ClinVar И осигуряваше доказателство за асоциация със заболяване, което позволяваше на проверката от v3.10.0 да мине. SHROOM2 (вероятно патогенен с 1 звезда, нулева асоциация със заболяване от Orphanet/ClinGen/AR_LOF_GENES/VCEP) валидираше собствената си проверка.
- Прагът за брой звезди за преглед >= 2 е последователен с PS1 (ps1_min_stars = 2): единично непрегледано подаване по ClinVar не представлява доказателство за асоциация със заболяване на ниво ген. Двама или повече независими подаващи с конкордантна интерпретация (2+ звезди) осигуряват значима валидация на връзката ген–заболяване.
- Въздействие върху проверките за заболяване при PVS1 и PP3_Strong: минимално. И двете проверки използват същото CTE, но гените, при които PVS1 или PP3_Strong се активират, имат излишно доказателство за заболяване от Orphanet, хаплонедостатъчност по ClinGen, подбран списък на АР гени със загуба на функция (~150 гена) или покритие от VCEP. Ген, разчитащ единствено на ClinVar с 1 звезда за доказателство за заболяване, е точно типът ген, който не трябва да получава PVS1 (Very Strong) или PP3_Strong.
- Клиничен повод: SHROOM2 p.Gly211Ser остана LP след внедряването на v3.10.0. Сега коректно класифициран като VUS (ClinVar_gated).
- Приоритет на ClinVar: замяна с P/LP при брой звезди за преглед = 1 (единичен подаващ, без рецензия) вече изисква генът да има установена асоциация със заболяване от поне един от пет източника: P/LP по ClinVar (ниво ген), запис в Orphanet, оценка за хаплонедостатъчност по ClinGen, подбран списък на АР гени със загуба на функция (~150 гена) или покритие от VCEP. Без тази проверка единично подаване по ClinVar в ген без известен Менделов механизъм на заболяване би могло да повиши вариант до вероятно патогенен.
- Приоритет на ClinVar: твърдения P/LP с 2+ звезди за преглед (множество конкордантни подаващи) заобикалят проверката за асоциация със заболяване. Приоритетът на ClinVar за доброкачествен и вероятно доброкачествен не е засегнат от тази проверка.
- Приоритет на ClinVar: варианти, спрени от проверката (P/LP с 1 звезда в гени без асоциация със заболяване), преминават към стандартно ACMG оценяване, което обикновено дава VUS, когато не са активирани ACMG критерии.
- gene_has_disease_association: нова булева колона в етапа за оценка на критериите. Използва същата проверка за заболяване от 5 източника като проверката за PVS1 (v3.8.0) и PP3_Strong (v3.8.1). Нулев брой нови източници на данни, нулево допълнително натоварване на производителността.
- clinvar_disease_gated: нов булев за одитна следа. Низът с критерии показва префикс „ClinVar_gated“, когато замяната по ClinVar P/LP е блокирана от проверката за асоциация със заболяване, позволявайки на генетиците да идентифицират спрени варианти.
- Клиничен повод: SHROOM2 p.Gly211Ser в PD2025_060 - класифициран като LP от единично подаване по ClinVar (1 звезда) в ген с нулева асоциация със заболяване от всичките пет референтни източника (Orphanet, ClinGen, HPO, VCEP, AR_LOF_GENES), нулеви данни за нетолерантност (pLI/LOEUF/mis_z всички липсващи) и популационна честота от 0,23%.
- Източник: HELIX-CR-2026-007, Ghosh et al. 2018 PMID:30311383 (limitations of single-submitter ClinVar entries).
- PVS1: скъсяващи варианти в последен екзон са намалени от Very Strong (+8 точки) до Strong (+4 точки). Дърво за решения по ClinGen PVS1 (Abou Tayoun et al. 2018) Фигура 1, Възел 3: скъсяващите варианти в последния екзон избягват безсмислено-опосредственото разграждане на иРНК, защото няма надолу по веригата екзон-екзонен съединителен комплекс.
- PVS1: откриването на последен екзон използва колоната exon_number от VEP (формат X/Y, последен екзон когато X == Y). Липсващ или невалиден формат се третира като Very Strong (консервативен резервен подход). Гени с единичен екзон (1/1) коректно получават PVS1_Strong.
- PVS1: низът с критерии показва PVS1 за Very Strong (не последен екзон) и PVS1_Strong за варианти в последен екзон с намалена сила. Последователно с конвенцията за именуване PP3_Strong, BP4_Moderate.
- PVS1: защитата срещу двойно отчитане на PP3_splice е непроменена - използва оригиналното условие за PVS1, покриващо и пътищата Very Strong, и Strong.
- PVS1: намалението за последен екзон при AR_LOF_GENES се прилага независимо от начина на унаследяване. Избягването на разграждането е биофизичен механизъм, независим от АД/АР унаследяване.
- PVS1: въздействие върху класификацията - PVS1_Strong + PM2 = 6 точки = вероятно патогенен (най-честата минимална комбинация е незасегната). PVS1_Strong + PS1 пада от патогенен до вероятно патогенен.
- Клиничен повод: повторен преглед на PD2025_058 (MYO6 p.Lys972GlufsTer5, екзон 27/32 - НЕ последен екзон, незасегнат от промяната).
- Източник: Abou Tayoun et al. 2018 PMID:30192042.
- BP1: защита за патогенен вариант с променен смисъл по ClinVar - BP1 вече не се прилага, когато ClinVar има патогенен вариант с променен смисъл в същия ген. Ако ClinVar потвърди патогенен вариант с променен смисъл, предпоставката на BP1 е оборена. Използва данни от ClinVar на ниво сесия.
- BP1: клиничен повод - MCCC2 p.Val339Met в PD2025_099 получи BP1 въпреки наличието на патогенен вариант с променен смисъл по ClinVar. АР ензимните гени имат нисък mis_z, но патогенен хомозиготен вариант с променен смисъл.
- PP3_Supporting: етикетът в низа с критерии е променен от PP3 на PP3_Supporting за последователност с PP3_Strong и PP3_Moderate. ClinGen SVI (Walker et al. 2023) препоръчва изрично обозначаване на силата на доказателствата.
- PP3_Strong: проверка за асоциация със заболяване - PP3_Strong (BayesDel >= 0.518, ниво на доказателства Strong) вече изисква генът да има установена асоциация със заболяване от поне един от пет източника: P/LP по ClinVar (ниво ген), запис за връзка ген–заболяване в Orphanet, оценка за хаплонедостатъчност по ClinGen, подбран списък на АР гени със загуба на функция или покритие от VCEP.
- PP3_Strong: без тази проверка, PP3_Strong + PM2 биха могли да достигнат вероятно патогенен в гени без известен Менделов механизъм на заболяване. Клиничен повод: PD2025_056 идентифицира POU2F2 p.Val324Met и RYR3 p.Arg285Gln като погрешни LP класификации.
- PP3_Strong: научна основа - Pejaver et al. 2022 калибрира BayesDel върху варианти от ClinVar в гени със заболяване; Walker et al. 2023 (ClinGen SVI) Раздел 3.2 ограничава калибрираните прагове за PP3/BP4 до гени с установен механизъм на заболяване.
- PP3_Moderate и PP3_Supporting НЕ са ограничени от проверката за асоциация със заболяване (не могат да достигнат LP самостоятелно).
- Пътят за PP3_splice е непроменен (предсказанието за сплайсинг е независимо от механизъм на заболяване чрез промяна на смисъла).
- PVS1: проверка за асоциация със заболяване - PVS1 вече изисква генът да има установена асоциация със заболяване от поне един от пет източника: P/LP по ClinVar (ниво ген), запис за връзка ген–заболяване в Orphanet, оценка за хаплонедостатъчност по ClinGen, подбран списък на АР гени със загуба на функция (~150 гена) или покритие от VCEP. Популационната нетолерантност (pLI/LOEUF) сама по себе си вече не е достатъчна.
- PVS1: гени с висок pLI, но без известен Менделов механизъм на заболяване (напр. TTC28, ABL1, HTT) коректно са изключени от PVS1. Одит на гени в 5 валидационни случая: 250 гена блокирани, 92 гена преминават, проверка за безопасност по ACMG SF v3.2 преминала (0 от 81 засегнати гена).
- PVS1: Източник: Abou Tayoun et al. 2018 (дърво за решения по ClinGen PVS1) - „PVS1 е приложим, когато загубата на функция е известен механизъм на заболяване.“ HELIX-CR-2026-003.
- BS1: резерв с изведен от нетолерантност АД статус - когато няма данни за начин на унаследяване от нито един източник (Orphanet, ClinGen, HPO), но генът е нетолерантен към загуба на функция (pLI > 0.9 или LOEUF < 0.35), BS1 използва АД прага (0,1%) вместо стойността по подразбиране за АР (5%). Разрешава архитектурната несъответност, при която PVS1 третираше ген като АД хаплонедостатъчен, но BS1 го третираше като АР.
- BS1: изрични Orphanet АР и подбран AR_LOF_GENES са добавени като каскадни приоритети 5–6, гарантирайки, че изричното АР доказателство заменя изведения от нетолерантност АД статус.
- BS1: каскадата е разширена от 5 до 8 нива: VCEP > ClinGen HI > Orphanet АД > Orphanet Х-свързано доминантно > HPO АД > Orphanet АР > AR_LOF_GENES > изведен от нетолерантност АД > АР по подразбиране.
- BS1: низът с критерии вече включва анотации BS1[Orphanet-AR] и BS1[constraint-AD] за източника.
- Референтни бази: Orphanet/Orphadata и VCEP ген-специфични спецификации са документирани като отделни референтни бази (общо 9, преди това 7).
- Клинична валидация: TTC28 p.Arg21Ter (PD2025_100) се променя от LP на VUS. Анализ на несъответствия: критични находки за конфликт на честотата намалени от 1 на 0.
- BS1: каскада по Orphanet за начин на унаследяване за честотни прагове, съобразени с унаследяването. 5-нивов приоритет: VCEP ген-специфичен → ClinGen HI score=3 → Orphanet АД → Orphanet Х-свързано доминантно → HPO АД резерв → АР по подразбиране.
- BS1: покритие на Orphanet за АД: 1694 автозомно-доминантни гена (4-кратно подобрение спрямо ~400 от ClinGen HI самостоятелно).
- BS1: разграничение Х-свързано доминантно/рецесивно: Х-свързани доминантни гени (90) получават АД праг (0,1%); Х-свързани рецесивни гени (663) получават АР стойност по подразбиране (0,05%). Х-свързан без уточнение е съпоставен с Х-свързано рецесивно като консервативна стойност по подразбиране.
- BS1: HPO АД резерв (HP:0000006) като приоритет 4 покрива АД гени, отсъстващи от Orphanet (напр. KCNQ1, KCNH2 - покрити и от ClinGen HI).
- BS1: низът с критерии вече включва анотация за източника на унаследяване: BS1[ClinGen-HI], BS1[Orphanet-AD], BS1[Orphanet-XLD], BS1[HPO-AD].
- Референтна база: таблица orphanet_gene_inheritance е добавена (3197 гена, LEFT JOIN при класификация, <2 ms допълнително натоварване).
- Източник на данни: Orphadata CC-BY-4.0 (INSERM, Франция). Покрива ~6100 редки заболявания с анотации за връзки ген–заболяване–унаследяване.
- Валидация: 9/10 известни АД гена потвърдени (KCNJ11, GCK, HNF1A, FGFR3, SCN1A и др.), 4/4 гена само с АР непроменени, 5/5 гена с двойно унаследяване коректни.
- BP1: добавена защита mis_z < 2.0 за предотвратяване на BP1 в гени с нетолерантност към варианти с променен смисъл.
- BP1: гени с pLI < 0.1 И mis_z >= 2.0 (напр. KCNJ11, ABCC8, KCNQ1, SCN1A) имат промяната на смисъла като основен механизъм на заболяване - BP1 („предимно скъсяващите варианти причиняват заболяване“) е фактически некоректен за тези гени.
- Клинична валидация: KCNJ11 p.Leu270Val коректно губи BP1 след тази промяна.
- PP3: добавена защита за релевантност на промяната на смисъла. PP3 (BayesDel) вече изисква доказателство, че вариантите с променен смисъл причиняват заболяване в гена, преди да приложи изчислителното предсказание.
- Защитата на PP3 има четири нива: (1) mis_z > 2.0 за директна нетолерантност към варианти с променен смисъл, (2) mis_z > 1.5 И pLI < 0.5 за АР гени като BRCA2/MLH1/ATM, (3) mis_z > 0.5 И pLI > 0.9 за силно АД гени, нетолерантни към загуба на функция, (4) резервен подход при липсващи данни за гени без mis_z, но с pLI > 0.5.
- Пътят за PP3_splice е непроменен (предсказанието за сплайсинг е независимо от механизъм чрез промяна на смисъла).
- BP4 е непроменен (доброкачественото предсказание е последователно с ниска нетолерантност към варианти с променен смисъл).
- Научна основа: Pejaver et al. 2022 калибрира BayesDel върху гени с механизъм чрез промяна на смисъла; прилагането към гени с механизъм на загуба на функция е методологически некоректно.
- PM1: подбран списък CRITICAL_PFAM_DOMAINS (~60 домейна) замества общата проверка за наличие на Pfam домейн.
- PM1: само добре характеризирани функционални домейни с документирано клъстериране на патогенни варианти задействат PM1.
- PM1: изключени домейни: общи структурни (Caveolin, навити спирали), DUF, трансмембранни спирали, повтарящи се региони.
- PM1: включени домейни: каталитични домейни на кинази (PF00069, PF07714), ДНК-свързващи (PF00870, PF00505, PF00096, PF00533), пори на йонни канали (PF00520, PF00029, PF01365), ГТФаза (PF00071), активни центрове на ензими (PF00089) и ~40 допълнителни VCEP-документирани домейна. Съпоставянето на домейни използва идентификатори по Pfam от v3.14.0.
- Научна основа: ACMG 2015 изисква PM1 за „критичен и добре установен функционален домейн без доброкачествена вариация“ - не каквато и да е анотация от Pfam.
- PP2: вече изисква mis_z > 2.0 в допълнение към pLI > 0.5.
- PP2: ACMG 2015 изисква „вариантите с променен смисъл да са чест механизъм на заболяване“ - pLI самостоятелно измерва нетолерантност към загуба на функция, не нетолерантност към варианти с променен смисъл.
- PP2: mis_z > 2.0 гарантира, че генът е нетолерантен към варианти с променен смисъл (Samocha et al. 2014, Karczewski et al. 2020).
- Гени като CAV1 (pLI=0.846, mis_z=0.86) с механизъм на заболяване чрез загуба на функция вече не задействат некоректно PP2.
- PVS1: цялостно разширение на списъка на АР гени със загуба на функция от ~35 до ~150 гена.
- Списъкът на АР гени със загуба на функция покрива всички основни категории АР заболявания: невродегенерация, метаболитни (аминокиселини, окисление на мастни киселини, натрупване на гликоген, лизозомни, пероксизомни), цилиопатии, сензорни (слух, зрение), имунни/хематологични, сърдечни, нервно-мускулни, съединително-тъканни, бъбречни, ендокринни, чернодробни и дихателни.
- Всеки ген в подбрания списък има окончателна/силна оценка за валидност по ClinGen или еквивалентно публикувано доказателство за биалелен механизъм на заболяване чрез загуба на функция.
- VCEP АР гени (CDH23, GJB2, MYO7A, PAH, SLC26A4, USH2A) се обработват чрез проверката pvs1_applicable на VCEP, без дублиране в подбрания списък.
- Защита за хомозиготен референтен генотип: варианти с генотип hom_ref (0/0) са изключени от ACMG класификация.
- Вариантите hom_ref възникват от мултиалелни VCF позиции, при които пробата има 0 алтернативни четения за конкретен алел, но е включена поради друг алтернативен алел на същата позиция.
- Без тази защита, hom_ref варианти с изместване на рамката или поява на стоп-кодон в гени с нетолерантност към загуба на функция получаваха PVS1+PM2 = вероятно патогенен, въпреки че не присъстват в пациента.
- 20 погрешни класификации патогенен/вероятно патогенен са елиминирани при валидацията (Случай 19).
- PM2: липсваща честота на алела по gnomAD вече коректно удовлетворява PM2 (отсъстващ от контроли = никога не наблюдаван при ~800 хил. индивиди).
- PM2: предишното поведение изискваше данните за честота да са налични (не липсващи), некоректно изключвайки истински отсъстващи варианти.
- PVS1: подбран списък на АР гени със загуба на функция (~35 гена) замества широкото заобикаляне на базата на HPO (v3.6 използваше HP:0000007 с 3127 АР гена - прекалено широк, причини 43 погрешни вероятно патогенни).
- PVS1: подбраният списък включва само гени с доказателства от ниво окончателно/силно за биалелен механизъм на заболяване чрез загуба на функция (валидност на връзката ген–заболяване по ClinGen, литература).
- PVS1: автозомно-рецесивните гени заобикалят проверката за нетолерантност по pLI/LOEUF чрез анотация за начин на унаследяване по HPO (HP:0000007).
- PVS1: съобразено с дървото за решения по ClinGen PVS1 (Abou Tayoun et al. 2018), което не изисква популационна нетолерантност за гени с установен механизъм на загуба на функция при рецесивно унаследяване.
- Базата данни HPO вече се използва за идентификация на АР гени при PVS1 в допълнение към фенотипното съпоставяне по PP4.
- Бележка: заобикалянето на базата на HPO е заменено с подбран списък на гени във v3.6.1 поради прекалено широк обхват.
- Наслагване на ген-специфични спецификации от ClinGen VCEP (по избор, включено по подразбиране).
- BA1, BS1, PM2: ген-специфични честотни прагове от публикувани VCEP спецификации (~50–60 гена).
- PVS1: ген-специфична проверка за приложимост (деактивирана за гени с придобиване на функция).
- Одитна следа по VCEP: низът с критерии включва маркер [VCEP:Panel vX.Y], когато са приложени ген-специфични прагове.
- Превключвател за VCEP: може да бъде включен/изключен за всеки случай в настройките на случая.
- Източник: регистър на спецификации за критерии на ClinGen (CSpec).
- Байесова точкова система за класификация (Tavtigian et al. 2018, 2020) замества последователното оценяване по 18 правила.
- Всичките 18 оригинални ACMG правила за комбиниране дават идентични резултати при точковата система (обратно съвместимо).
- Точковата система запълва пропуски: комбинации от доказателства, непокрити от оригиналните 18 правила, вече се класифицират правилно.
- PP3/BP4: BayesDel_noAF като единичен инструмент замества претегления консенсус от 6 предиктора (калибрация по ClinGen SVI, Pejaver et al. 2022).
- Модулация на силата на доказателствата при PP3: Strong (>= 0.518), Moderate (0.290–0.517), Supporting (0.130–0.289).
- Модулация на силата на доказателствата при BP4: Moderate (<= -0.361), Supporting (-0.360 до -0.181).
- Защита от двойно отчитане PM1 + PP3: комбинираното доказателство е ограничено до еквивалент на Strong (4 точки).
- Непрекъснати стойности на увереност, изведени от точковото разстояние до границата на класификационния праг.
- Противоречивите доказателства се обработват чрез сумиране на точки (по-нюансирано от двоичната стойност VUS по подразбиране).
- Проверка за безопасност при конфликт с висока достоверност: силно/много силно патогенно срещу силно доброкачествено се отбелязва за ръчен преглед.
- Наследени предиктори (SIFT, AlphaMissense, MetaSVM, DANN, PhyloP, GERP) са запазени само за показване.
- Прагът на SpliceAI за PP3 е съобразен с препоръката на ClinGen SVI 2023 (понижен от 0.5 на 0.2).
- PP3_splice е изключен, когато PVS1 се прилага (защита срещу двойно отчитане по ClinGen SVI).
- BP7 е подобрен: синонимен + не в сплайс-област + SpliceAI <= 0.1 (Walker et al. Фигура 4).
- Филтърът за консервираност при BP7 умишлено е пропуснат съгласно Walker et al. Таблица S13.
- Модулация на силата на доказателствата (PP3_Moderate за висока стойност по SpliceAI) е отложена до публикуване на VCEP спецификации.
- Интеграция на SpliceAI: път PP3_splice за доказателства за сплайсинг.
- Защита на BP4 по SpliceAI: изисква максимална оценка < 0.1 за доброкачествен консенсус.
- Низът с критерии разграничава PP3 (варианти с променен смисъл) от PP3_splice (сплайсинг).
- Подход с максимална чувствителност: премахнато всякакво предварително филтриране по честота и въздействие.
- Всички варианти, преминали проверката за качество, преминават през класификация.
- Клиницистите решават клиничната релевантност въз основа на класификацията и анотациите.
- Приоритет при противоречиви доказателства: патогенно + доброкачествено доказателство дава VUS.
- Самостоятелен приоритет на BA1: честота на алела > 5% винаги се класифицира като доброкачествен.
- Приоритетът на ClinVar е ограничен само до непротиворечиви доказателства.
- Класификационен механизъм, базиран на SQL (100-кратно подобрение на производителността).
- PM2: изискваше налични данни за честота (не липсващи) (коригирано във v3.6.1).
Литература
- Tavtigian SV, Greenblatt MS, Harrison SM, et al. Modeling the ACMG/AMP variant classification guidelines as a Bayesian classification framework. Human Mutation. 2018;39(11):1485-1492. PMID: 30311386
- Tavtigian SV, Harrison SM, Boucher KM, Biesecker LG. Fitting a naturally scaled point system to the ACMG/AMP variant classification guidelines. Human Genetics. 2020;139(8):1057-1067. PMID: 32666219
- Pejaver V, Byrne AB, Feng BJ, et al. Calibration of computational tools for missense variant pathogenicity classification and ClinGen recommendations for PP3/BP4 criteria. American Journal of Human Genetics. 2022;109(12):2163-2177. PMID: 36413997
- Richards S, Aziz N, Bale S, et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 2015;17(5):405-424. PMID: 25741868
- Walker LC, Hoya M, Wiggins GAR, et al. Using the ACMG/AMP framework to capture evidence related to predicted and observed impact on splicing: Recommendations from the ClinGen SVI Splicing Subgroup. American Journal of Human Genetics. 2023;110(7):1046-1067. PMID: 37352859
- Jaganathan K, Kyriazopoulou Panagiotopoulou S, McRae JF, et al. Predicting Splicing from Primary Sequence with Deep Learning. Cell. 2019;176(3):535-548.e24. PMID: 30661751
- Karczewski KJ, Francioli LC, Tiao G, et al. The mutational constraint spectrum quantified from variation in 141,456 humans. Nature. 2020;581(7809):434-443. PMID: 32461654
- Cheng J, Novati G, Pan J, et al. Accurate proteome-wide missense variant effect prediction with AlphaMissense. Science. 2023;381(6664):eadg7492. PMID: 37733863
- McLaren W, Gil L, Hunt SE, et al. The Ensembl Variant Effect Predictor. Genome Biology. 2016;17(1):122. PMID: 27268795
- Landrum MJ, Lee JM, Benson M, et al. ClinVar: improving access to variant interpretations and supporting evidence. Nucleic Acids Research. 2018;46(D1):D1062-D1067. PMID: 29165669
- Abou Tayoun AN, Pesaran T, DiStefano MT, et al. Recommendations for interpreting the loss of function PVS1 ACMG/AMP variant criterion. Human Mutation. 2018;39(11):1517-1524. PMID: 30192042
- Josephs KS, Roberts AM, Grozeva D, et al. Beyond gene-disease validity: capturing structured data on inheritance, allelic requirement, disease-relevant variant classes, and mechanism for inherited cardiac conditions. Genome Medicine. 2023;15:86. PMID: 37884986
- Cummings BB, Karczewski KJ, Kosmicki JA, et al. Transcript expression-aware annotation improves rare variant interpretation. Nature. 2020;581(7809):452-458. PMID: 32461655
Въпроси за методологията?
Ще се радваме на технически въпроси от клинични генетици и ръководители на лаборатории. Прозрачността е в основата на доверието.