Поздравляем наших коллег из FeatureCloud, Юнджун Пак, Анн-Кристин Хаушильд и Доминика Хайдера, с их последней публикацией о том, как трансферное обучение компенсирует некоторые проблемы, возникающие при секвенировании отдельных клеток.

Огромные достижения в технологии секвенирования следующего поколения позволили за последнее десятилетие накопить большое количество данных омики в различных областях исследований. Однако ограничения исследования из-за небольшого размера выборки, особенно в клинических исследованиях редких заболеваний, технологической неоднородности и эффектов партии ограничивают применимость традиционной статистики и анализа машинного обучения. Здесь мы представляем подход к обучению с метапереносом для переноса знаний из больших данных и сокращения пространства поиска в данных с небольшими размерами выборки. Алгоритмы быстрого обучения интегрируют метаобучение для преодоления нехватки и неоднородности данных путем переноса моделей распознавания молекулярных образов из наборов данных несвязанных областей. Мы изучаем модели обучения с несколькими выстрелами с крупномасштабными общедоступными наборами данных, например. TCGA (Атлас генома рака) и набор данных GTEx, а также продемонстрировать их потенциал в качестве наборов данных для предварительного обучения в других задачах распознавания молекулярных паттернов. Наши результаты показывают, что метатрансферное обучение очень эффективно для наборов данных с ограниченным размером выборки. Кроме того, мы показываем, что наш подход может передавать знания через технологическую неоднородность, например, от объемных ячеек к данным одной ячейки. Наш подход может преодолеть ограничения размера исследования, эффекты партии и технические ограничения при анализе данных одной клетки за счет использования существующих данных секвенирования большого количества клеток.

https://academic.oup.com/nargab/article/3/4/lqab104/6426025