Анализ данных и машинное обучение

Модераторы: Обучение, Moderators

Ответить
  Репост: Репост в ВКонтакте Репост в Facebook Репост в Одноклассники Репост в Twitter Репост в Мой мир Репост в LiveJournal Версия для печати
CAH4O_C_PAH4O
Сообщения: 69
Зарегистрирован: 11 авг 2013, 19:17

Анализ данных и машинное обучение

Сообщение CAH4O_C_PAH4O »

Среди членов отряда есть специалисты по анализу данных/машинному обучению? Хотелось бы обсудить возможности этих технологий для выполнения поисковых задач. Знаю про нейронную сеть, обрабатывающую снимки с БПЛА. Мне кажется, что отряд формирует довольно большой объём данных с треками навигаторов и геопозициями найденных потеряшек. Что если попробовать анализировать эти и ещё какие-то входные данные данные с целью выявления устойчивых паттернов, приводящих к успешному/неуспешному завершению поиска, и определения оптимальной тактики поиска в похожих обстоятельствах?
903-179-26-32

aorlov
Сообщения: 1
Зарегистрирован: 27 июл 2020, 16:20
Позывной: aorlov

Re: Анализ данных и машинное обучение

Сообщение aorlov »

CAH4O_C_PAH4O писал(а):
19 июл 2020, 13:07
Среди членов отряда есть специалисты по анализу данных/машинному обучению? Хотелось бы обсудить возможности этих технологий для выполнения поисковых задач. Знаю про нейронную сеть, обрабатывающую снимки с БПЛА. Мне кажется, что отряд формирует довольно большой объём данных с треками навигаторов и геопозициями найденных потеряшек. Что если попробовать анализировать эти и ещё какие-то входные данные данные с целью выявления устойчивых паттернов, приводящих к успешному/неуспешному завершению поиска, и определения оптимальной тактики поиска в похожих обстоятельствах?
Специалисты есть. Если им предоставить онлайн доступ к описываемым данным для анализа и обрисовать хотя бы примерное понимание логики выявления паттернов, то задача реализуема. Но нужно понимать, что все связанное с искусственным интеллектом сейчас очень дорого и требует серьезных вычислительных мощностей. Это серьезный, небыстрый и непростой ресерч, но вполне реальный

CAH4O_C_PAH4O
Сообщения: 69
Зарегистрирован: 11 авг 2013, 19:17

Re: Анализ данных и машинное обучение

Сообщение CAH4O_C_PAH4O »

aorlov писал(а):
27 июл 2020, 16:44
CAH4O_C_PAH4O писал(а):
19 июл 2020, 13:07
Среди членов отряда есть специалисты по анализу данных/машинному обучению? Хотелось бы обсудить возможности этих технологий для выполнения поисковых задач. Знаю про нейронную сеть, обрабатывающую снимки с БПЛА. Мне кажется, что отряд формирует довольно большой объём данных с треками навигаторов и геопозициями найденных потеряшек. Что если попробовать анализировать эти и ещё какие-то входные данные данные с целью выявления устойчивых паттернов, приводящих к успешному/неуспешному завершению поиска, и определения оптимальной тактики поиска в похожих обстоятельствах?
Специалисты есть. Если им предоставить онлайн доступ к описываемым данным для анализа и обрисовать хотя бы примерное понимание логики выявления паттернов, то задача реализуема. Но нужно понимать, что все связанное с искусственным интеллектом сейчас очень дорого и требует серьезных вычислительных мощностей. Это серьезный, небыстрый и непростой ресерч, но вполне реальный
Вот что мне удалось выяснить со слов Гилдора (старший по направлению картографии):
1.В настоящий момент все обработанные треки всех ПСР хранятся на сервере в определенном месте. Их можно посмотреть онлайн по каждому поиску, где они были записаны. Значит онлайн доступ к описываемым данным есть.
2. Кроме треков также сохраняются и отображаются точки. Поэтому имеется не только координаты пропавшего, но и координаты важных объектов, которые были обнаружены в процессе ПСР. Значит есть и разметка (найден/не найден, если найден, то где и когда).

Если я не ошибаюсь, самая дорогая задача в машинном обучении это разметка данных, она у нас есть. Что касается стоимости вычислений, так у нас не терабайты данных и мы собираемся анализировать координаты, а не картинки или видео. Это не должно быть сложно и затратно. Может быть удастся получить доступ к вычислительной инфраструктуре, на которой нейронка Билайн( вроде бы?) обрабатывает снимки БПЛА. Наша задача сильно проще распознавания образов.
Логику выявления паттернов и вообще постановки задачи нужно обсуждать с участием опытных координаторов. Именно они должны сказать, какой результат такого анализа им мог бы быть полезен. Могу предположить, что это будет задача оптимизации ресурсов отряда, например оптимальное изменение соотношения ресурсов, направленных на разные типы задач (отклик/прочес/оконтуривание) в зависимости от времени с момента начала ПСР. Хотя конечно здесь очень сильная зависимость от топографии места ПСР, подать ее на вход модели мы никак не можем (разве что координатами, в общем виде описывающими регион поисков: Истра, Руза, Орехово-Зуево...).
Я бы для начала предложил сделать выборку поисков, на которых было задействовано много лис (хотя бы больше 10) и потерявшийся был найден относительно быстро (например менее суток но более 5 часов - чтобы данных было больше). После этого выполнить задачу кластеризации, чтобы выявить группы чем-то схожих поисков. После чего посмотреть на треки похожих поисков глазами и попытаться понять, чем они похожи (может там координатор будет один и тот же) - это и будут некие паттерны, которые можно использовать в качестве входных данных для следующих моделей.
903-179-26-32

Mustang
Сообщения: 37
Зарегистрирован: 19 мар 2020, 15:40

Re: Анализ данных и машинное обучение

Сообщение Mustang »

Добрый день.
Это не Билайн :)
https://habr.com/ru/company/ods/blog/483616/

Севыч
Moderator
Сообщения: 1922
Зарегистрирован: 13 окт 2011, 16:23
Позывной: Севыч

Re: Анализ данных и машинное обучение

Сообщение Севыч »

Mustang писал(а):
31 июл 2020, 21:43
Добрый день.
Это не Билайн :)
https://habr.com/ru/company/ods/blog/483616/
У Билайна для ЛА есть своя версия нейросети для поисков с БПЛА, но в отличие от Лакмус процессы совершенствования и обучения нейросети закрыты и непонятно, как и что делают они сейчас (а делают ли вообще?).

Лакмус же прозрачен, добровольцы ЛА, задействованные в проекте, открыты для общения и сейчас обучают нейросеть пятой версии. Очень нуждается как в размеченных, так и неразмеченных фотографиях с БПЛА с высот в 45-55 метров. Цель Лакмус: безвозмездно дать всем добровольным поисково-спасательным отрядам России качественную нейросеть для облегчения поиска объектов с фото и видеоконтента с БПЛА.
Админ Лакмус Виктория (Ёжик с котомкой) +7.9О5.778.4278
"Тот, кто спасет ЖИЗНЬ человека, тот спасет целый МИР."
"Для больших дел не нужны большие усилия, но при условии, что делающих много".
Новичкам сюда www.первыйпоиск.рф
Канал "Будет поиск!" https://t.me/budet_poisk/174

Аватара пользователя
gserrg
Сообщения: 7
Зарегистрирован: 05 май 2019, 17:17
Позывной: серж

Re: Анализ данных и машинное обучение

Сообщение gserrg »

Я не являюсь экспертом в данном направление, но имею сносное представление о нём, буду очень рад, если ошибаюсь.

Всё не так просто, как кажется. Сами треки скорее укажут не где искать потеряшку, а на патерны в работе того или иного координатора.

На самом деле наиболее полезны координаты точек старта и обнаружения потеряшки. Но они имеют пользу только если проведена оцифровка местности: рельеф, флора, акустика, личность пропавшего и прочие факторы -- вот с этим и засада.

Лакмус разрабатывается в рамках одного из проектов https://ods.ai/ (направление Machine Learning for Social Good), можно попробовать туда зайти с этим вопросом.

CAH4O_C_PAH4O
Сообщения: 69
Зарегистрирован: 11 авг 2013, 19:17

Re: Анализ данных и машинное обучение

Сообщение CAH4O_C_PAH4O »

gserrg писал(а):
01 авг 2020, 18:36
Я не являюсь экспертом в данном направление, но имею сносное представление о нём, буду очень рад, если ошибаюсь.

Всё не так просто, как кажется. Сами треки скорее укажут не где искать потеряшку, а на патерны в работе того или иного координатора.

На самом деле наиболее полезны координаты точек старта и обнаружения потеряшки. Но они имеют пользу только если проведена оцифровка местности: рельеф, флора, акустика, личность пропавшего и прочие факторы -- вот с этим и засада.

Лакмус разрабатывается в рамках одного из проектов https://ods.ai/ (направление Machine Learning for Social Good), можно попробовать туда зайти с этим вопросом.
Где искать потеряшку, мне кажется, не подскажет ни одна известная технология. Хотя если точно знать точку входа (что бывает очень редко) и точку обнаружения можно было бы анализировать паттерны маршрутов блуждания в лесу. Возможно, какие-то закономерности выявились бы в зависимости от географии, возраста, состояния здоровья и времени, проведенного лесу. Пока я вижу задачу как раз в выявлении успешных паттернов ПСР. Их можно в дальнейшем анализировать и обсуждать с участием опытных членов отряда и использовать в качестве рекомендаций при похожих вводных, например для начинающих координаторов. Любые другие идеи использования технологий ИИ приветствуются для обсуждения. Лично мне жалко, что накопленный отрядом опыт в виде такого большого массива данных никак не анализируется.
903-179-26-32

CAH4O_C_PAH4O
Сообщения: 69
Зарегистрирован: 11 авг 2013, 19:17

Re: Анализ данных и машинное обучение

Сообщение CAH4O_C_PAH4O »

Я вышел на команду фонда Лакмус, которая делает нейронную сеть для анализа снимков БПЛА (координирует их работу с ЛА Виктория Мартынова) с предложением анализа данных треков. Они считают, что на данных треков и спутниковых снимков места ПСР можно обучить нейронную сеть предсказывать вероятность нахождения пропавшего в определённом квадрате. То есть обучить сеть на фотоснимках местности, точке входа, места нахождения. Потом на новом поиске подавать сети на вход снимки и точку входа. Обученная сеть отсортирует квадраты по вероятности нахождения в них человека. чтобы проверить эту гипотезу им нужно провести исследование, для которого нужны данные, требования к которым обсуждали в чате. Вот выдержки из чата:

наиболее ценными данными была бы совокупность треков (в идеале - с временными отметками по точкам, если возможно), данных с коптеров с того же поиска + топопривязка

имхо максимум что надо делать пока это просто предикт возможной территории куда мог убежать человек. но опять же тут нужна хорошая карта. и хорошие офм снимки. их парсить и делать лок2век.

тут ценность - если треки с временными метками - в прогнозировании скорости движения пешего в зависимости от типа местности

радиус поиска? на основании точки входа и обнаружения, сезона, времени суток обнаружения пропажи, возраста и топологии местности. Снимкм местности тоже кстати можно прогнать через сверточную нейронку и использовать как признак

Да. Нужны только снимки притом скорее всего не с дрона а со спутника.
Satilite image + векторная карта.
И на основании этого можно выделить закономерности. Сферткой брать фичу тайла. И говорить. С какой вероятно человек может находиться в этом квадрате
Как то так
То есть у нас есть радиус поиска. Мы можем его сузить на основе этих данных.
И например ранжировать какие территории стоит осмотреть с помощью бпла в первую очередь а какие в последнюю
И на основе этого составить маршрут для бпла.
Не тупо змейкой. А например как то по умному.
И данные фотографий ла нам не нужны. Только треки. Фотки можно со спутника парсить.
Потому что нам важна карта местности в первую очередь.
Ну короче loc2vec как он есть фактически.

В общем точно нужны данные треков с отметками мест где нашли человека. Фотографий самого человека не нужно. Просто треки и отметки. И все. На мой взгляд это по идее не секретная инфа. Типо ничего такого в этом нет.
Тогда мы берём квадрат спутниковых изображений в котором проводился поиск.
Раскалдываем их. И просим ранжировать наиболее вероятные тайлы (500*500 рx в 20 масштабе) где может находиться человек. И выдавать матрицу смежности.
Квадрат - вероятность нахождения человека.

можно работать исходя из общедоступной информации о человеке. Возраст, пол. Разбивка по местам нахождения относительно возраста\пола - даст уже пищу для дальнейшего анализа.

Короче
С тебя треки.
Помеченные на них точки где найден человек
И если есть инфа о человеке)
Постарайся оперировать открытыми данными.
Типо треки и точка нахождения этого в принципе достаточно.
О человеке только пол и возраст если открытая инфа. Если закрытая забей.
Типо классы мы можем сами определить.
Если есть функция
(характеристики человека) => вероятное его местоположение то велик шанс что существует и обратная)
Ну и да данных нужно оч много. Прямо дофига.
На этом сайте лично я не вижу квадрат нахождения человека. Только треки. Этого не достаточно.
Нужен обязательно квадрат нахождения.

Короче
Треки и точка нахождения. Все. Этого достаточно.
много данных - это хотя бы 50 поисков. Лучше - 100. Ещё лучше - 1000.


Да. Но для начала как пример 1-2 поиска будет достаточно.
И главное. Важна
1. Открытость данных
2. Простота их добычи.
То есть вот треки которые лежат в открытом доступе круто.
То что надо.
Ещё нужны гео-привязки точки нахождения человека. Все. Если это тоже открытая инфа и её можно легко парсить то огонь. Если закрытая то печаль - беда.
Тогда пусть ЛА открывают. С закрытыми данными мы работать не будем.

Мне кажется что точка нахождения человека тоже не закрытая инфа. Типо. Личных данных в ней нет. Никаких.
Последний раз редактировалось CAH4O_C_PAH4O 27 авг 2020, 22:40, всего редактировалось 2 раза.
903-179-26-32

CAH4O_C_PAH4O
Сообщения: 69
Зарегистрирован: 11 авг 2013, 19:17

Re: Анализ данных и машинное обучение

Сообщение CAH4O_C_PAH4O »

Все точки, кроме сетки, т.е. там, где были найдены артефакты, или там, где поисковая группа что-то услышала, в том числе и там, где нашла БВП, заносятся в один общий файл с расширением .wpt. Мне удалось получить 2 комплекта треков, но в одном не было файла .wpt, в другом он был, но в нем отсутствует точка нахождения БВП. Дальнейшие запросы треков не были согласованы старшим по направлению картографии, т.к. он считает, попытки проведения исследования возможностей машинного обучения бесперспективными. Поэтом оставляю собранную информацию здесь, на случай если найдутся желающие продвинуться в этом направлении дальше.
903-179-26-32

Аватара пользователя
goblin37
Moderator
Сообщения: 3837
Зарегистрирован: 06 май 2011, 20:55
Позывной: Канва
Статус: Не выездной.

Re: Анализ данных и машинное обучение

Сообщение goblin37 »

Основная наша проблема это сбор данный.
При нынешнем уровне и количестве аналитиков пронализировать объём данных не составит труда.
Но нужно собрать и разложить эти данные в начале.
8-926-374-25-70
Что пользы, братия мои, если кто говорит, что он имеет веру, а дел не имеет? Апостол Иаков
Лисам при выходе в лес надо выдавать мозг. Не менее одного на группу. (с) stalker69

Ответить

Вернуться в «IT»