О городах и данных @datainthecity Channel on Telegram

О городах и данных

@datainthecity


Канал про то, кто, как и зачем измеряет города: как исследования,построенные на городских данных, улучшают жизнь в городе и какие риски они несут
Автор:@intra23
Сайт: http://geopython.su/

О городах и данных (Russian)

Добро пожаловать на канал "О городах и данных"! Этот канал, с названием на русском языке, представляет собой уникальное сообщество, которое исследует и обсуждает важные темы, связанные с измерениями и данными городов. На канале вы найдете информацию о том, кто проводит измерения в городах, какие данные они собирают, и зачем это делают. Автор канала - @intra23 - делится интересными материалами и анализами, которые помогают лучше понять, как исследования, основанные на городских данных, могут улучшать жизнь в городе. Помимо полезной информации, на канале также обсуждаются риски, с которыми сталкиваются исследователи данных при работе с информацией о городах. Если вас интересуют инновации в области городского планирования, умные технологии и данные, то этот канал станет для вас настоящим кладезем знаний. Посетите наш сайт по ссылке: http://geopython.su/ и присоединяйтесь к нам на канале "О городах и данных" уже сегодня!

О городах и данных

17 Feb, 08:19


Как и обещала, продолжаю делиться с вами новостями моего PhD 🎓
(нравится оно вам или нет 😃)

Последний раз я остановилась на том, что мне удалось найти домашние и рабочие локации юзеров по их GPS-координатам, записанным в период 01/2019–09/2023.
С того момента я сделала три попытки оценить месячный уровень удаленной работы и хочу вкратце поделиться с вами результатами.

📌 Код можно найти у меня на GitHub

---

🔹 Идея 1:
📍 Удаленка = _доля домашних сигналов, случившихся в рабочие часы (11:00–16:00)_

🔸 Результат:
📊 При таком расчете уровень удаленки оказался самым высоким в 2019 г. и самым низким в месяцы локдауна (04–05/2020).

Почему
🔹 В месяцах разная доля сигналов в рабочие часы.
🔹 В ковидные месяцы почти все сигналы записаны либо рано утром, либо поздно вечером.

---

🔹 Идея 2:
📍 Удаленка = _доля рабочих часов (11:00–16:00), в которые сигналы получены из домашней локации._
_Месяцы с низким числом рабочих часов исключены._

🔸 Результат:
📊 Сильный рост удаленки во второй локдаун (09/2020), но уровень удаленки в 2019 выше, чем в 2023.

Почему
🔹 У юзеров разная частота рабочих часов внутри месяца.
🔹 Одна случайная домашняя локация в 11:00 при отсутствии других сигналов днем → доля удаленки = 100%.
🔹 Индивидуальные рабочие графики могут отличаться.

---

🔹 Идея 3:
📍 Удаленка = _доля часов, в которые у юзера вероятность быть на работе выше, чем в любой другой локации, но фактически он находился дома._
_При этом ни в один час того же дня юзер не посещал офис._

🔹 Как?
Используем Bayesian conditional probability :

P(O|h) = P(O) * P(h|O) / P(h)
где:
- P(O|h)- вероятность для юзера быть в офисе в конкретный час невыходного дня с 8 утра до 7 вечера
- P(O) — доля офисных часов в дни посещения офиса.
- P(h) — доля конкретного часа в офисные дни.
- P(h|O) — доля конкретного часа среди часов с сигналом из офиса в офисные дни.

Удаленка определяется как:
P(O|h) > P(H|h) & P(O|h) > P(3rdP|h)& Home Location
где:
- P(H|h) — вероятность для юзера быть дома в конкретный час.
- P(3rdP|h) — вероятность для юзера быть в третьей локации в конкретный час.

🔸 Результат:
📊 Резкий рост удаленки в период 04/2020–10/2020, постепенное снижение в 2021–2023, но доля все еще выше, чем в 2019.

О городах и данных

10 Feb, 13:25


Анализ гео-сферы 2024 года по результатам опроса

Осенью 2024 года мы провели опрос ГИС-специалистов, и сегодня публикуем первую часть его результатов. В ней общая информация про опрос и тех, кто принял участие.

Из кого состоит наша сфера, и какие выводы можно по этому делать? Какие есть перспективы? С каким образованием и в каких компаниях работают люди?
Читайте в статье "Анализ гео-сферы 2024. Часть 1: знакомство со сферой геотехнологий" ⚡️

Спасибо всем, кто участвовал в опросе и кто поделился им!
Мы продолжим оформлять материал в статьи с графиками и делиться информацией, которая поможет делать более осознанные карьерные решения.

О городах и данных

03 Feb, 19:16


В тему полезных AI. За последнее время слышала про NotebookLM хорошие отзывы уже от четырех человек

О городах и данных

03 Feb, 19:16


Ты уже послушал подкаст про свою научную статью?

Звучит немного странно, но я вот слушаю прямо сейчас.

Как? Загружаю pdf своей статьи или какого-то научного обзора или даже учебника в систему, задаю примерный фокус и стиль обсуждения, и через несколько минут получаю натуральный подкаст, в котором двое ведущих с интересом обсуждают мою работу.

Послушайте файл, это просто вау! Тут, например, обсуждают нашу статью про наночастицы золота в ситаллах.

Отдельный восторг, что в этот разговор можно включиться и задавать голосом свои вопросы «ведущим», а те будут отвечать.

Кто делает эту магию? Платформа NotebookLM от Google, причем абсолютно бесплатно.

«Аудиопересказ» - это лишь одна из фишек. Главная функция в том, чтобы извлекать нужные данные одновременно из разных источников, сравнивать их между собой и писать тексты на основе данных.

К примеру, можно загрузить несколько файлов статей, позадавать вопросы и попросить сформулировать различия в методах исследования или в полученных результатах. С учебником удобно работать разбирая разные главы: создавать саммари и вопросы для проверки.

Важно, что система выдает ссылки на те части документа, откуда она взяла информацию. То есть нет не только «галлюцинаций», но еще и понятно, какая часть статьи была обработана для ответа.

В общем пока NotebookLM - это самый топ для ученых и преподавателей из всего «ИИ-многообразия», что я видел. (Работает только на компьютере и только с VPN).

P.S. пост взят у @shakhgildyan (почему-то не отразилось при перессылке)

О городах и данных

24 Jan, 11:38


Planet AI Symposium 30-го января

Выглядит как что -то интересное, хотя программы я не нашла. Точно известно, что про AI и гео, что бесплатно и что онлайн)

О городах и данных

21 Jan, 16:34


На днях коллега на работе рассказал, что установил себе Cursor AI, и теперь и код и документацию стало писать гораздо проще.. чем с ChatGPT🙄

Я тоже установила ( выглядит один в один как Visual Studio Code) и второй день кайфую: дописывает код по аналогии, ищет ошибки в логике внутри как отдельного файла, так и всего проекта, создаёт описание итд. В общем пока сплошные плюсы. Посмотрим потребует ли он в какой-то момент денег, но пока все бесплатно.

И я понимаю,что вокруг еще множество других AI инструментов, делающих рутину менее рутинной.

Поэтому мне очень интересно, какими инструментами кроме chatgpt пользуетесь вы и для каких задач. Напишите, в комментариях:) Получившийся список выложу отдельным постом.

О городах и данных

31 Dec, 12:54


Если вам вдруг станет скучно отдыхать на выходных, рекомендую почитать посты на этом ресурсе.

Авторы, 3 профессора из университетов США и Испании, разбирают академические статьи ( в основном behavioral science) с целью поиска в них фрода при работе с данными. Они пытаются повторить шаги исследователей на расширенной выборке или другими стат методами и проверить получается ли такой же результат как в статье. Один из авторов подал на них в суд иск на 25млн долларов - так что все серьезно:)

На мой взгляд очень полезное чтение с точки зрения понимания подводных камней при разработке дизайна исследования.

О городах и данных

27 Dec, 15:30


​​# PhD #mobiledata

Давно не было тут новостей про мой PhD, а работа тем временем кипит. Я завела проект на гитхаб, где можно следить за работой:)

Теперь пара слов о том, что я делаю.

В работе я исследую влияние удаленной работы на экономику городских районов. Моя гипотеза в том, что люди, которые часть времени работают из дома стали менее чувствительны к времени, которое заменяет дорога на работу, но при этом больше обращают внимание на доступность сервисов, кафе, магазинов вокруг дома. И такое поведение меняет экономику городских районов.

Свою гипотезу я проверяю на центральном районе Израиля, где большинство рабочих мест и развлечений сосредоточено в Тель-Авиве, а спальные кварталы расположены вокруг, в городах-спутниках.

Так вот, за последние два месяца я сделала первые шаги для того, чтобы оценить долю удаленьщиков в кварталах городов центра Израиля. Точнее измерить как менялся ее уровень с 2019 по 2023 год.

Мне повезло получить данные о GPS-локациях от компании Habidatum, поэтому измерения я делаю на мобильных сигналах, что должно дать мне результат более точный, чем опросы.

Почему "первые шаги"? Потому что с учётом размера данных каждый месяц приходится обрабатывать по-отдельности и потому что оценка удаленки оказалась не такой простой, как в теории. Пока я научилась с уверенностью находить дом и работу юзеров на каждый месяц данных- это было тоже непросто. Код можно найти на гитхаб, большой текст про подход у меня в бусти.

Знаю, что большинство читать не будут), поэтому кратко тут:
- правила о времени и частоте сигналов дома и на работе сработали лучше кластеризации;
- сначала пришлось найти дом и из оставшихся локаций работу;
- корреляция домашних локаций с населением 0.65
- ошибка первого рода рабочих локаций и официальных рабочих зон 4%.

Про так, как в итоге получилось посчитать долю работы из дома, напишу в следующих постах. А пока, можете пожелать мне удачи😊

О городах и данных

12 Dec, 16:34


Ребята привет! Ищем геоаналитика в юнит открытий ПВЗ компании Wildberries.

Задача команды геоаналитики - понимать, сколько мы хотим открывать ПВЗ и в каких местах + как смотивировать собственников на открытие именно в нужной для нас точке. Продукт, который служит достижению этой цели - карта открытий (часть алгоритмов под капотом этой карты написала команда геоаналитики).
Цель по открытиям достигается через набор моделей (предсказание оборота старых и новых ПВЗ, перегруза, вероятности открытия, расходов и доходов собственника и ВБ и других).
Вам предстоит заниматься как написанием новых и развитием существующих моделей (выдвижение гипотез, построение фичей и таргета, анализ результата и корректировка модели, построение финального пайплайна), так и ad hoc запросами от бизнеса (пример: проанализировать распределение оборотов в малых городах стран СНГ, подготовить предложения по изменению параметров зон карты в этих городах, защитить результат перед бизнесом).

Мы ожидаем, что у вас есть:
* Уровень от middle и выше (3+ года в программировании и QGIS - каждом по отдельности);
* Опыт работы с python (geopandas), PostGIS, QGIS;
* Знание и практическое применение мат. статистики и алгоритмов ML;
* Самостоятельность (готовность понять проблему заказчика и преобразовать в техническое решение);
* Интерес к геоаналитике, желание развиваться в этой сфере;
* Будет плюсом опыт в: osmnx, networkx, momepy.

Мы предлагаем:
* Сложные интересные исследовательские задачи, менторство и команду аналитиков, которым не всё равно;
* Гибридный формат работы в Москве (2 раза в неделю встречаемся в офисе на м. Тульская);

Для связи пишите Виктории @VSH_job (скажите, что пришли через канал Инессы Трегубовой - ребята с такой рекомендацией проходят облегчённый первичный скриннинг)

О городах и данных

12 Dec, 12:18


в тему foundation models

О городах и данных

12 Dec, 12:18


While there is a constantly growing number of publications about the integration of large models (#LLMs, Visual language models) with spatial apps—both academic and marketing 😎 — we added our two bits from solving real business cases.
Next time you see a lot of comments under another LinkedIn post featuring #geoai and #arcgis as a game changer of this integration, take a deep breath and remind yourself about hitting the target. 😃

О городах и данных

02 Dec, 05:00


Я тут осознала, что очень отстала от жизни. Почему? Потому что до Гошиного поста про новую Urban Foundation Model от Google, никогда про них не слышала - а судя по этой статье, за последние 2 года их популярность стремительно набирает обороты, и есть уже модели под самые различные задачи от прогноза загруженности дорог до анализа потребления электричества. Точнее их прелесть в том, что одна такая модель может помочь решить обе задачи, и еще пару 10тков других.

Вобщем, я очень эксайтед попробовать дообучить одну из таких моделей либо под рабочую, либо под PhD задачу, но это займет время. Поэтому пока написала открытый пост у себя в boosty с тем, чтобы немного разобраться в концепции foundation models в гео.

И да, если у кого-то есть опыт разработки или использования такой модели, поделитесь. Очень интересно

О городах и данных

27 Nov, 15:02


🛜 Страны мира с наибольшим числом людей, лишенных доступа к интернету

Индия лидирует по числу людей, не имеющих доступа к интернету – 684 миллиона (48% населения страны). На втором месте – Китай, где вне сети остаются 336 миллионов человек (24%).

В Африке наибольшая доля населения без интернета зафиксирована в Эфиопии – 81%, в Уганде – 73%, а в Демократической Республике Конго – 71%. В Танзании, Нигерии и Бангладеш около 55% населения также не подключены к сети.

Основные причины такого разрыва – недостаток инфраструктуры, высокая стоимость подключения и бедность, особенно в сельской местности.

О городах и данных

19 Nov, 09:23


Вакансия: Геоаналитик в команду доставки ВкусВилла 🥑

Всем привет!
Ищем геоаналитика в команду доставки ВкусВилла. Мы открыты к творческим и инициативным людям, готовым развивать доставку вместе с нами!

Какие задачи вас ждут:
🔴Анализ и решение исследовательских задач для бизнеса на основе геоданных с применением методов геостатистики;
🔴Поиск пространственных зависимостей в данных;
🔴Подготовка автоматических геоаналитических отчетов;
🔴Продуктивизация сервиса и внедрение аналитических решений;
🔴Выполнение множества ad hoc запросов от смежных команд.

Мы ждем вас, если вы:
🔴Уверенно владеете Python и основными библиотеками для анализа (гео)данных (например, (geo)Pandas, Folium, NumPy, Scikit-learn и др.), а также SQL и QGIS/ArcGIS;
🔴Понимаете, как работают алгоритмы классического машинного обучения и имеете опыт их применения;
🔴Понимаете основы статистики и умеете применять их на практике;
🔴Владеете инструментами автоматической отчетности, такими как Power BI.

Отправляйте резюме и задавайте вопросы Арине @arirrr
Очень ждем и будем рады обмениваться опытом ❤️

О городах и данных

15 Nov, 15:14


Месяц назад Яндекс запустил свою геоаналитическую платформу, и у меня получилось пообщаться с одним из ее аналитиков, Арсланом (@ars_gaz).

Арслан учился во 2-ом потоке моего курса, поэтому помимо инсайтов про платформу, он поделился еще своим опытом перехода от учебных задач к практическим в большой компании. Кажется, получилось интересно.

Читать тут👀

О городах и данных

05 Nov, 11:06


Картетика проводит исследование рынка труда гео-специалистов 📊

Мы продолжаем собирать информацию про нашу профессиональную деятельность. В прошлом году мы делали исследование гео-вакансий по данным HH. Но то, что пишут в резюме и вакансиях, только частично отражает общую картину.

Чтобы углубить наше знание о реальном положении дел, в этом году мы сделали свой опрос. Он для всех, кто причисляет себя к гео-специалистам 🗺

Примеры вопросов, на которые мы хотим и пытаемся найти ответы:
- какие зарплаты у нас в сфере
- какие навыки и ПО сейчас актуальны на рынке
- как много тех нас, кто работает на нескольких работах
- какая фактическая география нашего рынка труда

⚡️Как можно поучаствовать в исследовании:
- пройдите опрос самостоятельно, это займёт 7-10 минут
- поделитесь опросом с друзьями и коллегами, которые работают в нашей сфере

Чем больше ответов мы соберём, тем полнее и показательнее будут результаты💪🏻 Результаты опроса мы выложим открыто и добавим к ним свежие данные по вакансиям.

О городах и данных

30 Oct, 09:49


Послушала и очень рекомендую детальный и открытый разговор про OvertureMaps с их исполнительным директором.

Вот основные темы беседы:

1. Что такое OvertureMaps

2. Как устроены данные: иерархия источников достоверность

3.Для кого данные: как скачать, целевая аудитория, примеры использования

4. Сравнение с другими источниками ( OSM)

5. Особенности публикации открытых данных

6. Членство в OvertureMaps : зачем маленьким компаниям присоединяться

О городах и данных

28 Oct, 15:30


Мы с Женей (@zhenks_notes) продолжаем общаться с основателями российских стартапов в сфере геоинформатики, чтобы узнать их истории, и как в условиях текущей глобальной турбулентности они строят стратегии развития своих компаний.

В этот раз мы общались с Ольгой Ведерниковой, основательницей геоаналитической платформы Эпсилон Метрикс. От Оли мы узнали, что значит развивать геоаналитическую платформу сегодня на российском рынке и как происходит трансформация из менеджера банка в основателя стартапа. Прочитать краткую версию нашего разговора можно тут

О городах и данных

11 Oct, 04:57


Не столько про данные, сколько про хорошее и полезное исследование для горожан:

Редакторское бюро «Гладлакс» выпустило спецпроект о том, как пешеходам оставаться в безопасности на дорогах.

В статье приведены цифры (данные ГИБДД, могут содержать неточности) и свидетельства, которые, к сожалению, потверждают, что пешеход всегда в зоне риска и нужно оставаться бдительными.

Из того, что зацепило меня:

- в октябре и ноябре происходит больше всего дорожных аварий с участием пешеходов ( удивляет правда, что только 7% аварий без пешеходов)

- Почти треть от всех ДТП в России за 2023 год произошла именно с пешеходами

- Среди смертельных случаев в 3 из 4 раз виноват пешеход

- авторы подтверждают, что ошибки проектирования повышают риск аварий, включая смертельные

О городах и данных

02 Oct, 11:15


Тот случай, когда и аналитиком быть не надо)) Обычно говорят "как грибов", теперь буду говорить "Как McDonald's". Не знаю, к сожалению, источник картинки

О городах и данных

28 Sep, 14:34


Со временем все больше убеждаюсь, что важным компонентом анализа городских данных является понимание основ устройства города: экономических, социальных, экологических, правовых и тд. Поэтому тем, кто как и я, пришел в сферу из дата аналитики, рекомендую присмотреться к новости ниже.

P.S. Я пожертвовала вечером выходного и записалась на теорию социологии города к Петру)


Онлайн-школа урбанистики и городских исследований
«Города» открывает новый поток обучения!

Миссия этого проекта — делиться знаниями в сфере урбанистики и городских исследований, объединять единомышленников и развивать сообщество урбанистов, архитекторов, градостроителей, управленцев, культурологов и активных горожан.

Преподаватели Школы — известные в своих сферах специалисты, которые получили знания в полях и создали авторские курсы. Программы будут интересны как профессионалам, так и тем, кто только начинает погружаться в сферу урбанистики.

«География для архитекторов» от главного редактора журнала «Экоурбанист» Ольги Максимовой, «Социальное проектирование в малых городах» от культуролога и социального антрополога Дмитрия Лисицина, первый в России онлайн-курс по созданию дог-френдли среды от автора проекта «Собакин город» Артёма Гебелева — в новом потоке Школы 8 курсов, а ещё — медленный книжный клуб, где вместе с единомышленниками можно будет обсудить интересные книги по урбанистике.

📌Подробнее прочитать о курсах и записаться вы можете на сайте Школы: https://gorodaschool.ru/. Приглашаем!

О городах и данных

16 Sep, 11:22


Несколько около гео data science позиций в Лондоне и на Кипре в Wheely. За референсом пишите @mann_sarah
Ссылка

О городах и данных

11 Sep, 16:43


Привет! 🌏 Сегодня немного о кригинге.

Кригинг - это метод интерполяции. Он полезен при работе с данными, которые имеют неравномерное распределение или пропуски, и позволяет создавать карты с плавными переходами и естественными градиентами. 🔍

Основное преимущество кригинга заключается в его способности учитывать пространственные корреляции между точками данных, что обеспечивает более точные и надежные результаты по сравнению с другими методами интерполяции. ⚖️

🌟 Ниже небольшой, но мощный Python-класс, который соединил в себе силу регрессионных моделей и кригинга! 📊🌎
https://github.com/redsun1988/KreegingGridSearchCv/tree/master
Этот класс совместим со sklearn и позволяет легко интегрировать его c различными регрессионными моделями. А функция кригинга, поможет уменьшить ошибку предсказывая в областях, где информация отсутствует или ограничена.

Главная его особенность - возможность подбора оптимальных мета параметров для регрессионных моделей и кригинга с помощью GridSearchCv. Это позволяет экспериментировать с различными конфигурациями и находить наиболее подходящую модель для ваших данных.

Хотите больше узнать о Кригинге?
Вот ссылка на книгу Fifty Years of Kriging

О городах и данных

11 Sep, 16:43


По окончании курса слушатели не только делают проекты, но некоторые еще и дорабатывают библиотеки python, которые мы на курсе проходим.

Ниже пост от Максима, слушателя 3-ьего потока, который сделал свой extension к модели regression kriging- регрессионной модели усиленной с помощью пространственной модели, кригинг .

О городах и данных

01 Sep, 15:30


Недавно закончился 4- ый поток моего курса, поэтому время публиковать финальные проекты слушателей. Первый раз на моем курсе часть проектов была выполнена по запросу бизнес- заказчиков.

Юля Васильева(@Yulia_Yadrikhinskaya) сделала проект по рекомендации локаций для агентства среднесрочной аренды квартир в Тель-Авиве Midterm Dan.
Какие данные и подходы она использовала, а также какие результаты получила, читайте по ссылке

О городах и данных

31 Aug, 10:53


📢 We are looking for a full-time cartographer to join our AI training team.

You will support us with data labeling/validation, conducting mapping tasks, and contributing to the development of Geoalert’s platform for AI mapping using aerial and satellite imagery.

You would probably be a perfect candidate if:

You have 1-2 years of experience in cartography
You are experienced to work in QGIS
You are open to new technologies, methods, and approaches

What do we offer:

You will join the small team of cartographers under the supervision of ML engineer and a business manager.
We communicate in Russian and English.
We have a lot of opportunities for learning about new professional tools and growing your skills as a geospatial professional.

💲Salary depends on the technical level and experience, salary bump is TBD every 6 months
📍Remote work. Office location: Tashkent

Contacts to send your CV:
Email: [email protected]
Tg: @godnik0

Check for more vacancies at Geoalert on our web-site.

О городах и данных

29 Aug, 16:38


Сегодня у меня в университете закончился курс по пространственной эконометрике (Spatial Econometrics, SE) , который полностью поменял мое представление о пространственном анализе. Хочу поделиться некоторыми мыслями, и если будет интерес, пишите узнать подробнее, пишите - расскажу.

1. Сам по себе курс - большая редкость, даже в международных масштабах. Всего несколько университетов в мире читают его как отдельный, я знаю про еще 5: 1 в Голландии, 2 в UK, и 2 в US. Мне повезло, чувствую теперь себя членом тайного ордена)

2. У такой уникальности есть обратный эффект - я была единственной, кто записался на курс, хотя он доступен для всех студентов магистратуры и PhD факультета Социальных наук. Проблема в том, что на базовой эконометрике не рассказывают, что пространственная близость так же как и временная может влиять на наблюдаемые явления, а потому у студентов нет ощущения, что пространство - это важно.

3. Раньше в Глазго про методы SE мне рассказывали географы, на этом курсе мне повезло взглянуть на SE глазами эконометриста. Что я узнала? Ни один из методов не новый! Географы "придумали" то, что уже 100 лет существует эконометрике, точнее в time-series анализе.

4. Эконометрика позволяет "не ограничивать воображение" классическими методами вроде Spatial Autoregression или Global Moran's I.
Например:
- можно как угодно комбинировать пространственный и временные лаги. Мое любимое: dynamic spatial panel model, где все лаги собраны вместе - другими словами, есть переменные про вашего соседа вчера.

- в пространстве есть spatial autoregression, по аналогии с time autoregression - ваши решения как-то связаны с решением ваших соседей. Но есть разница: для времени нормально предположить, что патерн повторяется с шагом в несколько периодов, тогда как в пространстве предполагается связь только с ближайшими соседями. При этом если уйти от Global Moran's I из географии к Lagrange Multiplier Test из эконометрики, то можно мерить связь между соседями любого порядка в пространстве.

5. Обычно на каждое решение географа, про который он говорит "по опыту решил так" есть эконометрический тест, дающий однозначный ответ . Например,
- На вопрос: что значит пространственная автокорреляция в моей задаче: внешний неучтенный фактор или настоящее влияние соседей друг на друга? - ответ: common factor test

-На вопрос: какую матрицу связности выбрать ? - ответ: J Test for Non-nested models

Все это приводит к мысли, что SE - это серая зона социальных наук. С одной стороны все экономисты признают, что время важно, но почему-то отрицают важность пространства. С другой стороны, географы знают, что это важно, но не умеют моделировать. И лишь небольшая группа людей делает усилие по развитию SE, но их усилий недостаточно, чтобы ее "разрекламировать".

О городах и данных

24 Aug, 06:55


Мы с Женей (@zhenks_notes) продолжаем общаться с основателями российских стартапов в сфере геоинформатики, чтобы узнать их истории, и как в условиях текущей глобальной турбулентности они строят стратегии развития своих компаний.

В этот раз мы поговорили с Александром Каменевым (@kamestony), с фаундером компании AINO - компании, строящей Chat GPT на картах. Их история началась 2 года назад, но Саше уже было, что интересного нам рассказать. Прочитать краткую версию нашего разговора можно тут

О городах и данных

17 Aug, 16:00


Тут такое дело. Нам с Женей (@zhenks_notes) - моей коллегой по курсу "Умный город" и проекту Smarter.Space - пришла в голову идея узнать, что происходит сегодня с российскими стартапами в сфере геоинфоматики. Для этого мы решили провести серию интервью с CEO стартапов.

Первый с кем мы поговорили - Георгий Потапов(@godnik0), основатель компании GeoAlert. Разговор продлился больше часа, здесь мы собрали краткую версию, которую вы сможете прочитать за 10 мин.

P.S. если вы тоже руководитель стартапа/компании в сфере гео и хотите поделиться вашей историей, пишите в личку.

О городах и данных

16 Aug, 12:37


Aino ищет интернов в команду разработки AI для пространственных данных!

Aino(aino.world) — один из топ стартапов Европы, и мы ищем 2-3 человек на 2 месяца с гибким графиком.

🛠 Что нужно делать:
* Составлять датасеты для обучения ML модели text2sql (особенно для spatial SQL)

🎓 Требования:
* Навыки в GIS, SQL, PostgreSQL + PostGIS
* Базовый английский

💡 Что предлагаем:
* Менторство в AI, GIS, анализе данных и разработке веб-приложений
* Участие в процессах разработки вместе с ML командой
* Рекомендательное письмо
* Гибкий график
* Уникальный опыт работы над настоящим AI-продуктом (а не настройкой чат-GPT)

📩 Контакты:
* Telegram: @kamestony
* Email: [email protected]

О городах и данных

15 Aug, 10:31


Неожиданный вброс международной вакансии от одногруппницы моей подруги. А почему бы и не попытать счастья?

"Hey everyone! The Uber Maps team is hiring a senior data scientist, based out of Amsterdam, but the scope will be global. Is anyone here interested?

(you would have to relocate to Amsterdam, but the company would cover the costs)"

Писать: Melda +961 3 734 593

О городах и данных

14 Aug, 07:37


Наташа написала небольшой лонгрид про GeoPackage. Это популярный формат хранения геоданных, который обладает рядом преимуществ относительно других форматов. В материале есть про создание нового файла с нуля, сохранение и упаковку уже готовых слоев, сохранение стилей и проектов.
Ставьте 🤝, если вы уже используете GeoPackage, и 👍, если впервые о нём слышите.

#cartetika_tutorial

О городах и данных

13 Aug, 16:08


Интересная новость для меня как для PhD студента попалась в рунете: Яндекс провел пилот с ВШЭ по использованию YandexGPT для написания курсовых работ. Студенты использовали GPT для поиска релевантных источников, выявления ошибок, систематизации и обобщения источников.

Почему эта новость показалась мне интересной?

1. Во-первых, это сам факт такого пилота и согласие преподавателей на использование студентами LLM. Такая стратегия, на мой взгляд, самая успешная - процесс уже запущен, и GPT становятся одними из главных помощников студентов в учебе, освобождая время на творчество, и вузы к этому открываются. На мой взгляд, вузам полезно учить студентов использовать LLM для исследований, как это делают с Mendeley или Google Scholar.

2. Во-вторых, одна из курсовых работ, в которой использовался YandexGPT, была посвящена изучению умных городов Японии. Прочитав курсовую, могу сказать, что нейросеть неплохо справилась с агрегацией тонны документов на английском, изданных всеми возможными мировыми институтами про Smart Cities. Когда я училась в магистратуре - это было сплошной болью.

3. В-третьих, примечательно, что YandexGPT был применен на направлениях «Философия», «Медиакоммуникации», «Международные отношения» и «Востоковедение». Не знаю, было ли так задумано или получилось случайно, но успех курсовых говорит о том, что, по крайней мере, для русского языка инструмент работает хорошо.

P.S. с нетерпением жду когда Яндекс решит потестировать продукт с блогерами - попытки писать статьи с чат gpt оказались полным провалом))

О городах и данных

08 Aug, 09:38


Очень нравятся мне инициативы связанные с открытыми данными, которые имеют социальную значимость.

Прочитала сегодня в канале "О культурных маршрутах" про инициативу Голландии по созданию единой открытой базы пеших вело и конных маршрутов по всей стране. (Кстати рекомендую канал всем, кого интересует территориальное развитие через маршруты)

Посмотреть на карту глазами пользователя можно тут. Для доступа к данным нужна авторизация. Информация здесь

На сайте описаны несколько use case использования - интересно, что помимо очевидных приложений навигаторов, эту базу используют для оценки рисков для велосипедистов с точки зрения экологии и погодных условий. Хорошо быть велосипедистом в Голландии)

О городах и данных

06 Aug, 11:59


Contemporary Urban Studies Institute совместно с Университетом ИТМО и Исследовательской программой Urban HUB запустил новую образовательную программу “Управление современными городскими исследованиями” — Urban HUB executive.

Программа рассчитана на подготовленных специалистов из областей градостроительства, архитектуры, дизайна, социологии, экономики и муниципального управления, желающих повысить свои компетенции в области междисциплинарного взаимодействия, обобщить и расширить опыт в области современных городских исследований.

За 4 месяца обучения участники Программы изучат с теоретической и практической стороны 10 дисциплин и в полной мере реализуют полученные знания и навыки в рамках реального выпускного проекта.
Среди преподавателей программы — ведущие академические и отраслевые исследователи.

Прием заявок: с 1 августа 2024 по 12 сентября 2024
Продолжительность обучения: с 24 сентября 2024 по 31 января 2025

Формат: очный, онлайн обучение с двумя оффлайн сессиями в Санкт-Петербурге
Документ: диплом о повышении квалификации установленного образца.

📍Подробная информация: www.urbanhubedu.ru

Приглашаем к участию!

О городах и данных

07 Jul, 15:26


От подписчиков

Source: https://www.reddit.com/r/ProgrammerHumor/comments/1ddmad1/plannedvsunplanneddevelopment/

О городах и данных

06 Jul, 08:36


Вдохновившись постом Ивана Бегтина, я решила дать 2ой шанс сайту OECD, и попробовать найти что-то полезное для моего PhD в их базе данных. Данные можно получить либо через API, либо найти в Data Explorer

Меня интересовали 2 вещи: внутренняя миграция с 2019 года, и доля работников на удаленке. В 3 регионах: Барселона, Тель-Авив и Мельбурн.

Результаты получились 50/50.

По удаленке датасетов нет вообще, хотя в 2021 году они публиковали отчет про Teleworking. То есть как минимум, не ко всем репортам открыты датасеты.

По миграции данные есть для всех регионов, но глубже города спуститься нельзя, плюс нет информации о структуре миграции - откуда и почему люди переезжают. Зато есть net migration, по которой видно, что во всех 3 регионах после ковида чистая миграция отрицательная -хорошее обоснование для исследования.

Какие выводы:
Детальность данных невысокая. На мой взгляд статистика OECD подходит для макроисследований, или для обоснования актуальности работы, вроде: "в регионе отрицательный уровень миграции, давайте посмотрим в других источниках почему".

Из плюсов - большая география данных, в OECD входит 38 стран (России нет), что позволяет сходу сравнить регионы с разных концов планеты по одному набору показателей. Но и тут важно помнить, что далеко не по всем показателям, которые вам нужные будут все 38 стран