Привет, я Патрик. Я научный сотрудник Fetch.AI. Я занимаюсь феноменологией физики высоких энергий, и, проработав несколько лет академическим исследователем, я перешел в красочный мир технологических стартапов.

В Fetch.AI я работал над рядом предметов, проводя исследования протоколов консенсуса, изучая схемы подписи в децентрализованных и распределенных сетях, а в последнее время работаю над проектом интеллектуального анализа данных с одним из моих коллег, Дэниелом. Хонеркамп . В этой статье я остановлюсь на последнем.

Отправной точкой для проекта интеллектуального анализа данных является набор данных GPS Trajectory, собранный Microsoft Research Asia для проекта GeoLife. Самый последний набор данных состоит из траекторий, составленных из координат GPS, собранных 182 пользователями мобильных телефонов за период с апреля 2007 года по август 2012 года. Он состоит из последовательностей точек GPS с отметками времени. Имеется 17 621 траектория на общую протяженность 1 292 951 км с общей продолжительностью 50 176 часов. Набор данных имеет высокое разрешение, так как 91,5% траекторий были записаны плотно, то есть каждые 1 ~ 5 секунд. Кроме того, 62 пользователя предоставили информацию о своем способе передвижения по некоторым траекториям. Это означает, что в нашем распоряжении есть маркированные данные, которые можно использовать для обучения различных моделей машинного обучения. Следовательно, их можно использовать для прогнозирования режима транспортировки. К этому уже применялись различные подходы, но есть еще возможности для дальнейшего изучения.

Вдохновленные работой, проделанной группой исследователей Microsoft Research Asia, мы начали с определения так называемых точек пребывания. Точка остановки - это средняя точка всех точек в последовательности, где 1) расстояние от первой точки до каждой из последующих меньше порогового расстояния, D, и 2) где промежуток времени между первой и последней точкой в ​​последовательности превышает определенный порог, T. В популярных местах будет скопление точек пребывания, принадлежащих разным пользователям. Используя обучение без учителя (в данном случае кластеризацию), можно определить точки интереса (PoI). Это места, где многие пользователи обычно проводят определенное количество времени, и, следовательно, это места, которые могут быть восприняты как интересные по той или иной причине.

В настоящее время я изучаю способы, с помощью которых мы можем понять, какие пользовательские шаблоны можно найти в местах интереса. Используя эту информацию, я изучаю, какие удобства, коммунальные услуги, объекты и т. Д. Присутствуют в районе и каково их относительное расстояние до точки интереса. Метод, который я использую, заключается в том, чтобы посмотреть, сколько разных пользователей было в PoI, определить частоту посещений, распределение времени прибытия и ухода, время, проведенное там и т. Д. Эти данные могут быть использованы для предоставления нам информации о почему место кажется интересным и позволяет нам предоставлять пользователям более целенаправленные предложения по заданному PoI. Например, места работы и сна можно предположить и сопоставить либо с компаниями, либо с гостиницами и жилыми районами.

Как теперь очевидно, проект становится в значительной степени открытым, так как можно работать с разных сторон и собирать широкий спектр идей. Читатель может заметить, что до сих пор я использовал данные, которые не являются ни особенно новыми, ни очень локальными для моего непосредственного окружения. То, что я здесь описал, - это всего лишь первый шаг в гораздо больших усилиях. По сути, мы используем набор данных GeoLife Trajectory для создания прототипа запроса и анализа. Фреймворк, который возникнет из этого, может затем использоваться с другими, более новыми данными, включая данные, которые мы будем собирать на основе консенсуса здесь, в Fetch.AI, через Приложение для участия в сети, которое подключено к нашей бухгалтерской книге.

Такой подход дает огромные преимущества, но, что очень важно, мы также считаем, что конфиденциальность и безопасность данных чрезвычайно важны. Вот почему пользователи сети Fetch.AI смогут выбирать данные, которыми они хотят поделиться с другими.