Машинное обучение для диагностики заболеваний по полному профилю экспрессии генов
- Авторы: Михайлов А.М1, Каравай М.Ф1, Сивцов В.А1, Курникова М.А2
-
Учреждения:
- Институт проблем управления им. В.А. Трапезникова РАН
- Национальный медицинский исследовательский центр детской гематологии, онкологии и иммунологии им. Дмитрия Рогачева
- Выпуск: № 7 (2023)
- Страницы: 83-92
- Раздел: Интеллектуальные системы управления, aнализ данных
- URL: https://ruspoj.com/0005-2310/article/view/646754
- DOI: https://doi.org/10.31857/S000523102307005X
- EDN: https://elibrary.ru/FDMPHU
- ID: 646754
Цитировать
Полный текст



Аннотация
Рассматривается использование машинного обучения для диагностики заболеваний, основанной на анализе полного профиля экспрессии генов, что отличает данную работу от других подходов, где необходимо проведение предварительного этапа, на котором производится поиск ограниченного числа релевантных генов (десятки и сотни генов). Проведены эксперименты с полными профилями генетической экспрессии (20 531 генов), полученными в результате обработки транскриптомов 801 пациента с известными онкологическими диагнозами (онкология легких, почек, молочной железы, простаты и толстой кишки). Использование индекстрона (индексной системы мгновенного обучения) по новому назначению, т.е. для обработки полных профилей экспрессии, обеспечило точность диаг ностирования, которая на 99,75 процентов совпала с результатами гистологической верификации.
Об авторах
А. М Михайлов
Институт проблем управления им. В.А. Трапезникова РАН
Email: alxmikh@gmail.com
Москва
М. Ф Каравай
Институт проблем управления им. В.А. Трапезникова РАН
Email: mkaravay@yandex.ru
Москва
В. А Сивцов
Институт проблем управления им. В.А. Трапезникова РАН
Email: thedege@yandex.ru
Москва
М. А Курникова
Национальный медицинский исследовательский центр детской гематологии, онкологии и иммунологии им. Дмитрия Рогачева
Автор, ответственный за переписку.
Email: mish2109@yandex.ru
Москва
Список литературы
- Khan J., Wei J., Ringner M. et al. Classification and diagnostic prediction of cancers using gene expression profiling and artificial neural networks // Nat Med. (2001). June 7(6): 673-9. https://doi.org/10.1038/89044
- Kumar A., Halder A. Greedy fussy vaguely quantified rough approach for cancer relevant gene selection from gene expression data // Soft Comput. 2022. V. 26. P. 13567-13581. https://doi.org/10.1007/s00500-022-07312-4
- Houssein E., Hassan H., Mustafa al-sayed et. al. Gene Selection for Microarray Cancer Classification based on Manta Rays Foraging Optimization and Support Vector Machines // Arabian Journal for Science and Engineering. 2022. V. 47. P. 2555-2572. https://doi.org/10/1007/s13369-021-06101-8
- Zheng Y., Sun Y., Kuai Y. et al. Gene expression profiling for the diagnosis of multiple primary malignant tumors // Cancer Cell Int. 2021. V. 21, Article no. 47. https://doi.org/10.1186/s12935-021-01748-8
- Ye Q., Wang Q., Qi P. et. al. Development and validation of a 90-gene real-time PCR assay for tumor origin identification // Symposium MXW, 2018.
- Joshi P., Dhar R. EpICC: A Bayesian neural network model with uncertainty correction for a more accurate classification of cancer // Sci. Rep 12, (2022). Article no. 14628. https://doi.org/10.1038/s41598-022-18874-6
- Steiling K., Christenson S. Tools for genetics and genomics: Gene expression profiling // UpToDate.(2021). Retrieved from https://www.uptodate.com/contents tools-for-genetics-and-genomics-gene-expression-profiling
- СПбГУ Научный парк. Система высокопроизводительного полногеномного секвенирования, 2023. https://researchpark.spbu.ru/equipment-biobank-rus/equipment-biobank-genom-rus/equipment-biobank-ngsseq-rus/1762-biobank-hiseq-2500-sequencing-system-rus
- IBM. What are neural networks? // Retrieved from https://www.ibm.com/cloud/learn/neural-networks
- Mikhailov A., Pok Y.M. Artificial Neural Cortex // Smart Engineer. Syst. Design. 2001. V. 11. ASME PRESS. N. Y. P. 113-120.
- Mikhailov A., Karavay M. Pattern Inversion as a Pattern Recognition Method for Machine Learning // Cornell University. 2021. Retrieved from https://arxiv.org/abs/2108.10242
- Brin S., Page L. The Anatomy of a large-scale hypertextual web search engine // Comput. Networks ISDN Syst. 1998. V. 30. Iss. 1-7. Stanford University, Stanford, CA, 94305, USA. Retrieved from https://doi.org/10.1016/S069-7552(98)00110-X
- Mikhailov A. Indextron // Artificial Neural Networks in Engineering Conf. (ANNIE 1998), St. Louis, Missouri, Nov. 4-7, 1998. Proceedings Vol. 8: ANNIE 1998, Publisher: ASME Press, ISBN: 0791800822
- Jones K. A statistical interpretation of term specificity and its application in retrieval // J. Document.: MCB Univer.: MCB Univer. Press, 2004. V. 60. No. 5. P. 493-502. ISSN 0022-0418
- Sivic J., Zisserman A. Efficient visual search of videos cast as text retrieval // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2009. V. 31. Issue 4. https://doi.org/10.1109/TPAMI.2008.111
- UCI. Machine learning repository // Retrieved from https://archive.ics.uci.edu/ml/datasets/gene+expression+cancer+RNA-Seq
- Mikhailov A., Karavay M. Indextron // Proceedings of the 10th International Conference on Pattern Recognition Application and Methods, 4-6 Feb 2021, Vienna, V.1-978-989-758-486-2. P. 143-149. https://doi.org/10.5220/0010180301430149
Дополнительные файлы
