Google  знает все

Все люди лгут — уверен специалист Google по Data Science Сет Стивенс-Давидовиц — они лгут друзьям и знакомым, лгут во время опросов, лгут самим себе, не говорят правды в социальных сетях. Все это очевидно несколько осложняет проведение социальных исследований. Однако, большие данные, которые стали доступны последние годы, открывают совершенно новые перспективы для нахождения правды об окружающем мире.

«Все врут. О том, сколько выпили по дороге домой. О том, как часто ходят в тренажерный зал, сколько стоят эти новые туфли, будут ли читать эту книгу. Они говорят, что больны, когда вполне здоровы. Они говорят, что будут на связи, когда не собираются этого делать. Они утверждают, что говорят не о вас, хотя именно вас они и обсуждали. Они говорят, что любят вас, хотя на самом деле это не так. Они говорят, что счастливы, хотя в действительности хандрят. Они говорят, что им нравятся женщины, тогда как предпочитают мужчин. Люди врут друзьям. Боссам. Детям. Родителям. Они обманывают врачей и мужей. Лгут женам. Они врут сами себе.»

Оказалось, например, что очень много интересной информации может дать анализ поисковых запросов пользователей в интернете — это практически сыворотка правды — вот где люди по-настоящему раскрывают свою подноготную. Таким образом можно подсчитать уровень расизма в стране, определить реальные политические предпочтения граждан, можно выявить неожиданные проблемы — например, что немало родителей жалеет о решении завести ребенка. Данные могут предложить нам новые типы фактов и более правдивые сведения.

«Главный аргумент в пользу того, что поисковые запросы в Google представляют собой ценнейшую информацию, состоит не в том, что их очень много, а в том, что люди в них весьма откровенны.»

Кроме того большие данные это хороший способ заглянуть в отдельные подмножества людских сообществ, чего не может зачастую предложить небольшая срезка в традиционных исследованиях.

А еще такой подход к исследованиям открывает широкое поле для проведение экспериментов и поиска причинно-следственных связей. Можно, например, более точно определить действительно ли работает реклама, или посмотреть правда ли, что выпускники Гарварда чаще добиваются успеха в жизни, чем выпускники других учебных заведений.

«Если ваша цель предсказать будущее – какое вино будет иметь приятный вкус, какие продукты нужно будет продавать, какие лошади будут бежать быстрее других, – вам не нужно слишком сильно беспокоиться о том, почему ваша модель работает так, как работает. Просто пользуйтесь.»

Однако большие данные имеют свои ограничения и риски. С помощью таких тестов и экспериментов можно делать, например, крайне цепляющую рекламу, или “неотпускающие” компьютерные игры. Данные могут давать юридическим лицам очень большую власть над простым человеком.

Книга Сета Стивенс-Давидовица это призыв к обсуждению того, что можно и чего нельзя делать с большими данными, как к ним подступиться и как отвечать на некоторые сложные, в том числе с этической точки зрения, вопросы.

«Все лгут. Поисковики, Big Data и Интернет знают о вас всё»
Cет Cтивенс-Давидовиц

Один ответ на “Google  знает все

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход /  Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s