Очень часто мы слышим, что слова учатся на практике, но как часто вы задумываетесь о преимуществах этого метода перед другими моделями обучения? Хамойе разработал подход к обучению, который включает в себя обучение на основе навыков, контекста и проектов. Вот почему мы можем быть очень уверены в наших стажерах на рынке труда, особенно в тех, кто религиозен в отношении стажировки Hamoye Data Science Internship. Говоря словами Конфуция, «я учусь и забываю. Я вижу и помню. Я знаю и понимаю».

HDSC Winter 2022 был спланирован таким образом, чтобы каждый помнил и понял, потому что именно так мы хотим строить будущее работы и поднимать следующий поколение решателей проблем, которые действительно нужны миру. Проект Capstone будет оцениваться экспертами, применяющими машинное обучение в повседневной деятельности. Помимо экспертного преимущества, которое вы получите от завершения проекта «Капстоун», вы получите возможность решать проблемы. Проблемы были взяты из 10 различных секторов мировой экономики, и решений, которые предлагают стажеры, будет достаточно, чтобы сделать мир лучше.

Эти 10 областей/секторов и их проблемы объясняются ниже:

ANN- ПРЕСТУПНОСТЬ И БЕЗОПАСНОСТЬ

Убийство женщин в Турции, 2008–2020 гг. Турецкий ресурс (Набор данных)

Фемицид — это убийство женщины (женщины или девушки) мужчиной из-за ее пола. Мы надеемся, что этот набор данных перестанет существовать. Однако Турция занимается этим так долго, что были сопоставлены данные за 12 лет — с января 2008 г. по август 2020 г. — с которыми можно выявить факты, задать вопросы или предложить решения. Этот набор данных можно найти здесь

Глобальный терроризм (Набор данных)

Содержащие данные о 180 000 нападений с 1970 по 2017 год, это коллекция насилия среди человечества и против него. Проверьте набор данных, чтобы начать исследовательский анализ ситуации в мире в эти времена и сделать с ним больше.

Реагирование на инцидент службы экстренной помощи полиции Сиэтла (Набор данных)

Вдохновленные насилием со стороны полиции в Милуоки, США, в эти данные были записаны ответы на звонки в службу экстренной помощи. Утверждается, что количество звонков в службу экстренной помощи сократилось из-за увеличения случаев насилия со стороны полиции. Узнайте, как много вы можете сделать с этим набором данных.

Кибербезопасность: распространенные уязвимости и риски (CVE) (Набор данных)

Чего никто не хочет, так это быть разоблаченным или чувствовать себя неуверенно в отношении личной информации во время серфинга в Интернете. Этот набор данных содержит некоторую общую информацию — уязвимости и риски безопасности, о которых нам следует знать.

ARIMA- ПОЛИТИКА И УПРАВЛЕНИЕ

Всемирный показатель управления (Набор данных)

В предоставленном наборе данных можно увидеть отчет о шести широких аспектах управления по Всемирным показателям управления (WGI) для более чем 215 стран и территорий за период 1996–2018 годов. Он включает в себя процесс отбора, контроля и замены правительств и т.д. Из этого набора данных можно получить много политической информации и идей.

Прогноз решения Верховного суда (Набор данных)

Хотите прогнозировать исход судебных дел по фактам, но с помощью искусственного интеллекта? С помощью этого богатого набора данных, содержащего 3304 дела, можно сделать так, чтобы окончательные вердикты можно было предсказать, подражая присяжным заседателям.

Мировой рейтинг ICPC (Набор данных)

International Collegiate Programming Contest — соревнование по алгоритмическому программированию для студентов колледжей. Набор данных представляет собой интересную подборку данных о соревнованиях за последние десять лет, которые можно использовать для определения следующего победителя, лучшей команды и т. д.

Выборы, COVID и демографические данные по округам: какие факторы повлияли на выборы в США в 2020 году? (Набор данных)

Потрясающая подборка данных «Как проходило голосование» за 2016 и 2020 годы (год COVID-19). Как видно, определенно есть факторы, вызвавшие сдвиг мнения избирателей между 2016 и 2020 годами. С помощью этого набора данных можно выяснить эти факторы, а также другие вещи, влияющие на результаты опроса в оба года по штатам. .

FastAI — БРАК И ГЕНДЕР

Предложения руки и сердца (Набор данных)

Одна из прекрасных вещей в жизни — это брак, и даже те, кто не хочет брака, развлекаются хорошим предложением. Вот набор данных о предложениях руки и сердца в Шри-Ланке, который можно использовать, чтобы предсказать, сколько предложений закончилось браком, сколько было принято и т. д.

Прогнозирование развода (Набор данных)

Вот ряд вопросов, которые задают парам, чтобы предсказать, переживет ли их брак угрозу развода или нет. Ответы можно использовать для запуска этого предлагаемого прогноза или любого другого вероятного прогноза, связанного с этим набором данных.

Гендерная статистика (Набор данных)

Полноценная гендерная статистика, основанная на факторах, имеет большой потенциал для анализа, прогнозов и т. д., особенно та, которая только что была обновлена, как этот набор данных.

K-Means – РАБОТА И КАРЬЕРА

Обнаружение мошенничества при приеме на работу (Набор данных)

Точно так же, как законные рабочие места рекламируются, особенно в Интернете, рекламируются и нелегальные рабочие места. Этот набор данных отображает различные типы вакансий, их местоположение, диапазон заработной платы, описания вакансий и роли. Применяя методы машинного обучения, мы можем помочь соискателям выявлять мошеннические объявления о вакансиях и развертывать систему рекомендаций по вакансиям.

HR-аналитика: смена работы специалистов по обработке и анализу данных — предскажите, кто перейдет на новую работу (Набор данных)

После того, как компания вложила значительные средства в обучение группы людей для конкретной работы, она не может определить, останутся ли стажеры после обучения. Итак, как мы можем предсказать, кто уйдет с работы или нет? Какие факторы влияют на их решение уйти или нет? Этот набор данных включает демографию, опыт и образование кандидатов для анализа.

Общественное восприятие искусственного интеллекта ИИ (набор данных)

ИИ вышел на первый план в 1956 году и с тех пор завоевал популярность во всем мире, сопровождаемый различными убеждениями, интересами и настроениями. Этот набор данных фиксирует уровни вовлеченности, пессимизма, оптимизма, необузданности конкретных надежд (в сфере здравоохранения и образования) и беспокойства (этические проблемы, влияние на рабочие места) по поводу ИИ за последние 30 лет в Нью-Йорке. Применяя методы машинного обучения, можно четко понять общественное мнение по теме.

Мошенничество с вербовкой (Набор данных)

Путешествие по поиску работы в нашем распоряжении почти полностью осуществляется онлайн, что подвергает этот процесс подозрительным действиям. Хорошая новость заключается в том, что машинное обучение (NLP) может помочь предсказать потенциальную аферу с набором персонала. Мошенничество с трудоустройством Aegean Dataset предоставляет более 17 000 реальных объявлений о вакансиях и 866 мошеннических объявлений о вакансиях в период с 2012 по 2014 год, чтобы помочь отличить мошенничество от реальной работы.

LSTM – ЗДРАВООХРАНЕНИЕ

Питание и здоровье (Набор данных)

Наши привычки в еде напрямую связаны с нашим здоровьем. Этот набор данных содержит информацию о еде, приготовлении пищи и нашем здоровье. Следовательно, с помощью инструментов машинного обучения можно предсказать, влияют ли на модели покупок продуктов доход и связь между индексом массы тела (ИМТ) и моделями приготовления пищи, а также потреблением свежей пищи или фаст-фуда.

Прогноз рака молочной железы (Набор данных)

Рак молочной железы является второй по значимости причиной смерти в мире и наиболее распространенным видом рака среди женщин. Набор данных из больниц Университета Висконсина содержит различные случаи рака молочной железы, чтобы помочь прогнозировать рак молочной железы у женщины.

Прогноз телесного жира (Набор данных)

В этом наборе данных представлены подробные измерения окружности тела 252 мужчин, включая окружность груди, процентное содержание жира в организме по уравнению Siri (1956), окружность колена, возраст, окружность бицепса (расширенного) и т. д. Поскольку практикующие врачи рекомендуют людям проверять свое здоровье, оценивая свое жировые отложения, с этими данными и адаптацией инструментов машинного обучения человек может точно измерить объем своего тела

Prophet – ЭКОНОМИКА И ОБРАЗОВАНИЕ

Стипендия Китая (Набор данных)

Китайское правительство предлагает многочисленные стипендии. Этот набор данных содержит подробную информацию о различных школах в Китае и типах стипендий, которые они предлагают.

Глобальная грамотность: расходы на образование и доступ к нему (Набор данных)

Всемирный банк — это межправительственная организация, деятельность которой направлена ​​на борьбу с бедностью путем предоставления кредитов и поддержки странам капитальных проектов, таких как образование. Этот конкретный набор данных предоставляет информацию о том, как расходуются средства на образование, бенефициарах и обзор глобального уровня грамотности.

Компании из списка Fortune 500, 1955 – 2021 (набор данных)

Ежегодно список Fortune 500 составляют разные компании. Этот набор данных содержит тысячи компаний, которые вошли в список с 1955 года по сегодняшний день, включая их рейтинги и годовой доход.

Ridge & Lasso – СПОРТ

Результаты женского международного футбола (Набор данных)

Много сказано о мужском международном футболе, но очень мало о женском. Предоставленный набор данных включает 4169 результатов женского международного футбола. Включены некоторые международные товарищеские матчи, особенно турниры.

Преимущество дома в футболе и баскетболе (Набор данных)

Набор данных включает информацию о различных лигах в разных видах спорта (баскетбол и футбол) по всему миру, а также некоторые основные факты о каждой стране, касающиеся феномена домашнего преимущества в спорте.

Прогноз травм для бегунов (Набор данных)

Набор данных состоит из подробного журнала тренировок голландской беговой команды высокого уровня за семилетний период (2012–2019 гг.). Мы включили в команду бегунов на средние и длинные дистанции, то есть тех, кто соревнуется на дистанциях между 800 м и марафоном. Это дизайнерское решение мотивировано тем фактом, что эти группы имеют сильные компоненты, основанные на выносливости, в их тренировках, что делает их тренировочные режимы сопоставимыми.

SMOTE- СОБЫТИЯ

Человек года, 1927 — настоящее время (Набор данных)

Предоставленный набор данных включает запись для каждой обложки журнала Time, на которой отдельное лицо или группа отмечены как «Мужчина года», «Женщина года» или (по состоянию на 1999 г.) «Человек года» и вдохновлены такими вопросами, как как

  • Кто чаще всего появлялся на обложке журнала?
  • Удостаивались ли какие-либо американские президенты чести за победу на выборах?
  • Как со временем менялись критерии выбора Человека года?
  • Стал ли выбор журнала более или менее спорным?

База данных авиакатастроф (дата 1929 г.) (Набор данных)

Предоставленный набор данных включает все происшествия гражданской и коммерческой авиации с регулярными и нерегулярными пассажирскими авиалайнерами по всему миру, повлекшие за собой человеческие жертвы, все авиационные происшествия со смертельным исходом при перевозке грузов, позиционировании, переправах и испытательных полетах, все авиационные происшествия с военно-транспортными происшествиями с 10 и более погибшими и т. д.

Дикая природа Африки (Набор данных)

Предоставленный набор данных был собран с первоначальной целью обучения встроенного устройства обнаружению животных в реальном времени в заповедниках Южной Африки. В этом наборе данных представлены четыре класса животных, обычно встречающихся в заповедниках Южной Африки: буйволы, слоны, носороги и зебры.

StandardScaler – ЛЮДИ

Индивидуальный прогноз (Набор данных)

Предоставленный набор данных был собран через форум Personality Cafe, поскольку он предоставляет большой выбор людей и их тип личности MBTI, а также то, что они написали. Включает в себя большое количество людей типа MBTI и написанного ими контента.

Распознавание рукописных символов (Набор данных)

Этот проект будет направлен на распознавание рукописных символов, то есть английских алфавитов от A до Z. Этого мы собираемся достичь, смоделировав нейронную сеть, которую нужно будет обучить на наборе данных, содержащем изображения алфавитов.

Распознавание языка жестов (Набор данных)

В этом проекте по распознаванию языка жестов мы создаем детектор знаков, который обнаруживает числа от 1 до 10, который можно очень легко расширить, чтобы охватить огромное количество других знаков и жестов рук, включая алфавиты.

Распознавание речевых эмоций (Набор данных)

Предоставленный набор данных включает выступления в формате файла .mkv. Цель проекта — разработать модель машинного обучения, которая сможет распознавать каждую речь.

XGBoost — ДОРОГА И АВАРИИ

Прогноз трафика (Набор данных)

Заторы на дорогах растут в городах по всему миру. Способствующие факторы включают рост городского населения, старение инфраструктуры, неэффективную и нескоординированную синхронизацию сигналов светофора и отсутствие данных в реальном времени. Предоставленный набор данных включает почасовые данные о дорожном движении на четырех различных перекрестках.

Аварии во Франции (Набор данных)

Ежегодно дорожно-транспортные происшествия уносят тысячи жизней. Набор данных предоставляется, чтобы помочь проанализировать возникновение и вероятность несчастных случаев во Франции.

Авиакатастрофа с 1908 года (Набор данных)

Предоставленный набор данных взят с сайта planecrashinfo.com и включает в себя дату, время, авиакомпанию, рейс, маршрут и т. д. Из предоставленного набора данных и ваших методов машинного обучения найдите любые идеи из набора данных, такие как

  • Какие операторы самые плохие?
  • Какие самолеты самые плохие?