Процесс становления специалистом по обработке и анализу данных может иногда напоминать бесконечный список покупок: получить больше сертификатов, больше алгоритмов, больше хитростей с Python… В статьях, которые мы публикуем на TDS, мы часто видим что мы знаем, может быть менее важным, чем решающий навык соединения, казалось бы, несвязанных точек в подход или решение, которое работает.
На этой неделе мы представляем три недавние статьи, в которых подчеркиваются преимущества использования имеющегося у вас опыта, а иногда и импровизации. Они занимаются совершенно разными проектами и темами — от гидрологии до Wordle — но всех их объединяет схожая творческая жилка. Давайте погрузимся!
- Могут ли Transformers успешно классифицировать сложные тексты? Джарен Р. Хабер, Томас Лу и Нэнси Сю терпеливо рассказывают нам о своем увлекательном проекте — от предварительной обработки до обучения модели и не только. — где они используют глубокое обучение, чтобы помочь людям читать и анализировать научные ресурсы, процесс, который они называют вычислительным обзором литературы.
- Как лучше всего решить головоломку Wordle? Маловероятно, что вы еще не слышали о Wordle, но насколько надежен ваш подход к решению каждой ежедневной задачи? Вероятно, не такой сильный, как у Седжал Дуа. Недавно Седжал подробно рассказал о лучших стратегиях для победы в игре и даже создал инструмент на основе ИИ, который поможет вам быстрее находить нужное слово.
- Как AutoML может помочь в прогнозировании наводнений (и победе в хакатонах). Креативность и быстрое мышление являются важными составляющими успеха в науке о данных и соревнованиях по машинному обучению; Михаил Сарафанов и его команда использовали все возможные инструменты в своем наборе навыков, чтобы создать выигрышную модель для прогнозирования наводнений в России. Статья Михаила представляет собой увлекательный пошаговый пример эффективного решения проблем.
За последние недели мы опубликовали десятки других отличных пояснений, анализов и учебных пособий — вот краткий пример некоторых из рекомендуемых нами прочтений, каждое из которых соединяет точки по-своему, оригинально:
- Анжела Ши поделилась чрезвычайно полным (и чрезвычайно полезным) обзором алгоритмов обучения с учителем.
- Если вы готовы сделать следующий шаг в своем путешествии по магии баз данных, Мэтт Сосна недавно опубликовал доступное руководство по SQL среднего уровня.
- Чтобы получить пищу для размышлений о текущем состоянии и основных проблемах концепции гражданства данных, не пропустите новую статью Бенна Стэнсила и Марка Гровера.
- Чтобы повысить ваши навыки визуализации данных, мы собрали некоторые из наших лучших и новейших ресурсов по этой теме, охватывая графики, карты, библиотеки Python и общие принципы хорошего дизайна. (Также: кошки.)
Спасибо, что уделили время работе наших авторов — мы надеемся, что вы узнали что-то новое и полезное, исследуя ее.
До следующей переменной,
Редакторы TDS