Исследователи из Массачусетского технологического института создали LuminoCity, 3D-печатную копию кампуса Массачусетского технологического института, которая отображает большие данные Twitter в режиме реального времени с помощью нового агрегатора данных Twitter DecaHose и сети мониторинга качества воздуха CLARITY Массачусетского технологического института.
Большие данные - это общий термин для наборов информации, настолько больших, что их становится экспоненциально труднее собирать и обрабатывать. Поскольку наш мир продолжает развиваться в технологическом отношении, объемы генерируемых данных быстро превышают наши возможности обрабатывать их вручную. Автоматизированные сортировщики данных, такие как Twitter DecaHose от Gnip, могут принимать 500 миллионов твитов, которые мы генерируем в день, сортировать и фильтровать их по теме, тренду или любой другой точке данных, которая нужна пользователю, а затем разбивать их на более мелкие и понятные блоки. информации.

LuminoCity (PDF) - это напечатанный на 3D-принтере макет кампуса Массачусетского технологического института, оснащенный датчиками, подключенный к компьютеру и светодиодным фонарям, которые отображают данные в реальном времени, с которыми могут взаимодействовать пользователи. Они даже могут изменить параметры того, какие данные отображаются и где они отображаются.
Исследователи Виджай Гадепалли и Захари Вебе из лаборатории Линкольна Массачусетского технологического института разработали LuminoCity для отображения данных с геотегами, включая информацию Twitter, которая была обработана через DecaHose. Система автоматически анализирует информацию и может отображать актуальные темы и общее расположение тем для обсуждения. Он может даже показывать такие вещи, как задержки на дорогах, в режиме реального времени, анализируя количество людей, жалующихся на них в том месте, где они их испытывают.

Модель LuminoCity была напечатана на 3D-принтере из прозрачного материала, чтобы можно было легко увидеть светодиодные фонари и полностью оценить изменения цвета. Вместо того, чтобы отображать информацию на плоском мониторе, Гадепалли и Вебе использовали трехмерную модель, чтобы позволить пользователям визуализировать данные таким образом, чтобы мозгу было легче их понять и запомнить. Визуализация информации - это когда визуальные инструменты используются для усиления нашей способности извлекать значимую информацию из неоднозначных или абстрактных источников. Представляя данные Twitter в режиме реального времени в рамках трехмерной модели, пользователи могут получить более четкое представление о том, что означают данные в контексте среды, в которой они создаются.
Помимо данных из социальных сетей, LuminoCity также отображает большие данные из другого проекта Массачусетского технологического института под названием CLARITY. Проект CLARITY представляет собой систему датчиков, распределенных по всему кампусу Массачусетского технологического института, предназначенную для мониторинга и изучения загрязнения воздуха и качества местного воздуха в режиме реального времени. Как и цель LuminoCity, цель CLARITY состоит в том, чтобы поддерживать постоянно обновляемые наборы данных и превращать их в доступную и легкую для понимания информацию, соответствующую потребностям пользователей. Сенсорные узлы состоят из системы, которая использует лазеры для измерения плотности частиц в воздухе, датчиков альфа-сенсора, которые измеряют концентрацию загрязняющих веществ, и Raspberry Pi, заключенных в напечатанный на 3D-принтере корпус для защиты от непогоды.
Несмотря на все разговоры о конфиденциальности и о том, как социальные сети и маркетологи используют наши личные данные, количество информации, которую такие программы, как DecaHose, могут извлечь из наших твитов и обновлений статуса, немного экстремально. Но как бы люди ни жаловались на это, мы по-прежнему пользуемся социальными сетями. Мы по-прежнему разрешаем каталогизировать и хранить наши данные, и реальность такова, что это цена, которую мы платим за доступ к «бесплатным» сервисам, таким как Facebook, Google и Twitter.

Большие данные никуда не денутся, и возможность преобразовать эти данные в полезные сценарии информации, которую можно использовать, является неизбежной. Но пока мы генерируем эти данные, по крайней мере, кто-то нашел способ извлечь полезную информацию, которая не имеет ничего общего с продажей мне вещей, которые мне не нужны, и потенциально может быть использована, чтобы помочь всем реальным и значимым образом..