В 2017 году пользователи Яндекс.Навигатора и Яндекс.Карт оставили на карте Алматы больше 40 тысяч отметок о ДТП. Мы проанализировали их распределение на карте города и нашли наиболее аварийные и опасные места. Аварийные — те, в которых оказалось больше всего отметок. Опасные — места с самым высоким отношением числа аварий к числу проехавших машин, то есть такие, в которых вероятность стать участником или свидетелем ДТП выше среднего.
Отметки об авариях иногда используют не по назначению: например, чтобы сообщить о перекрытии дороги, пошутить или просто высказаться. Чтобы это не влияло на расчёты, мы учитывали только отметки с описанием ДТП (например, «ДТП на перекрёстке» или «ДТП дорогу закрыли») или указанием ряда, в котором произошла авария. Отметки, относящиеся к одному происшествию, склеивали. В результате осталось 22 тысячи отметок — по ним мы нарисовали тепловую карту аварий.
Сообщения о ДТП чаще всего оставляют на перекрёстках и развязках крупных магистралей: выделяются Ташкентский тракт, улица Саина (особенно участки с тоннелями) и проспекты Рыскулова, Райымбека и Аль-Фараби. Особенно много отметок у станций метро и на улице Абая: там много объектов притяжения — баров, ресторанов и торговых центров.
Опасность ДТП выше всего на перекрёстках магистралей на севере и западе города: опять выделяются проспекты Рыскулова и Райымбека, Ташкентский тракт, улица Саина. Самые опасные места сосредоточены на севере Алматы — шесть из десяти находятся на проспектах Рыскулова и Райымбека.
Самое опасное место, так же как и самое аварийное, — это участок Ташкенского тракта на выезде из города возле Алтын Орды: там всегда активное движение и много нарушений ПДД, хотя аварии обычно мелкие. В оба списка — самых опасных и самых аварийных мест — попали ещё два участка на проспекте Рыскулова: перекрёсток с улицей Ырысты и развязка с проспектом Суюнбая. От этих мест лучше держаться подальше.
Безопаснее всего на дорогах Алматы в марте, когда становится теплее и суше, а также в июле — в разгар сезона отпусков. В эти месяцы число сообщений об авариях на тысячу пользователей было наименьшим. В августе и сентябре значение этого показателя вновь возрастает и остаётся высоким до конца года. Годовой пик приходится на середину сентября.
Как мы считали
Мы разделили город на квадраты со стороной сто метров. Поскольку одной и той же аварии часто соответствует несколько точек и комментариев, все отметки, оставленные в пределах одного часа и попавшие в один квадрат, объединяли.
Аварийность квадрата считали по числу попавших в него отметок о ДТП. Опасность определяли как отношение числа отметок к числу проездов в квадрате.
Чтобы найти самые аварийные и самые опасные места, мы применили алгоритм «спуск с горы». Квадраты с наибольшим значением показателя аварийности или опасности считали центром кластера, его «вершиной». Соседние квадраты с меньшими значениями присоединяли к данному кластеру. Склейка прекращалась в двух случаях:
1) когда значение показателя в следующем квадрате было выше, чем в предыдущем, — такое место считали началом восхождения к новой «вершине», а значит, частью нового кластера;
2) когда значение показателя в следующем квадрате было в пять раз ниже, чем в квадрате-вершине, — такое место считали «долиной», концом спуска.