От Дмитрий Козырев
К Dargot
Дата 16.10.2013 14:44:20
Рубрики Суворов (В.Резун); Локальные конфликты; 1917-1939;

Re: Это деспотия

Дискуссия вцелом бессмысленна и беспредметна - каждый видит и верит в свое. Я кратко обрисую несколько моментов, коорые ты упорно игнорируешь:

1. Ресурсы и производительность (потребные для такого контроля). ты просто плохо себе представляешь эффект масштаба. Да, они дешевеют и почти экспоненциально растут. Но тем не менее уже охват небольших корпораций (десятки тысяч человек) выводит их на технически предельные цифры, не обеспечивая и десятой доли возможностей. которые ты деклалрируешь.
А задача деклалрируется обеспечить "контроль" сотен миллионов (в пределе - миллиарда (золотого) людей).

2. Технологии. Они еще и близко не подошли к он-лайн распознаванию речи и видео. Да "теоретически это так" и существуют демонстраторы технологий. Практически это требует тонких индивидуальных настроек и работает на множестве десятков-сотен объектов.
Не работает уже на десятках тысяч. См. п.1 про миллиард.
С поправкой на различные диалекты, фефекты фикции и сложную помеховую обстановку.
Тут ограничения носят уже даже не технологический, а как бы не физический характер.

3. Существующие национальные и административные организационные разделения.
даже абстрагируясь от пп 1 и 2 - организация такого контроля означает, что все ведомства делятся между собой информацией (или сливают ее в некий единый ЦОД). При этом все государства тоже делятся между собой этой информацией и сливают ее в единый ЦОД - все это работает на единых стандартах и форматах и по единым алгоритмам.
На текущем этапе построения общества, цивилизации это невозможно. Следовательно можно говорить разве что о каком то крайне отдаленой перспективе - а про нее можно вообразить все что угодно, в т.ч. бессмертие и неисчерпаемые источники энергии :)
Потому я и пошутил про "мировое правительство".

4. Тоже немаловажное.
Подобная система "анализа и мониторинга инцидентов" она на самом деле ничего не автоматизирует, как это не покажется странным.
Она создает колоссальный поток _новых_ задач для спецслужб. Даже ты сам пытался по ветке показать, что "отклонения от паттерна2 требуют реакции. И это тоже интересный момент - если человек автоматически не сажается в тюрьму или не эвтаназируется :) то "реагирование" требует отработки живыми людьми - сотрудниками спецслужб. Профилактики ли, дополнительной слежки и т.д. - вобщем мероприятий по "закрытию тикета".
И это потребует колоссального увеличения штатов спецслужб для подобных отработок. Иначе информация по "контролю" будет прокисать в своих гигаэксабайтных хранилищах - стоимость построения которых сопоставима с космической программой :)

От Dargot
К Дмитрий Козырев (16.10.2013 14:44:20)
Дата 16.10.2013 15:48:45

Re: Это деспотия

Приветствую!

>Дискуссия вцелом бессмысленна и беспредметна - каждый видит и верит в свое. Я кратко обрисую несколько моментов, коорые ты упорно игнорируешь:

>1. Ресурсы и производительность (потребные для такого контроля). ты просто плохо себе представляешь эффект масштаба. Да, они дешевеют и почти экспоненциально растут. Но тем не менее уже охват небольших корпораций (десятки тысяч человек) выводит их на технически предельные цифры, не обеспечивая и десятой доли возможностей. которые ты деклалрируешь.
Именно потому, что "небольшие корпорации" пытаются значительную часть функций осуществлять руками - это раз. И два - внедрение многих новшеств, типа того же распознавания лиц, в масштабах корпорации не имеет смысла - проще осуществить пропуск работников по карточкам. Эффект масштаба он и в обратном направлении работает - Интернет - нечто качественно большее, чем "соединенные друг с другом компьютеры". Распознавание всех лиц на всех камерах наблюдения даст качественно новые возможности по сравнению с распознаванием лиц на одной камере - например, выстраивание харакетрных маршрутов движения граждан и их статистический анализ.

>А задача деклалрируется обеспечить "контроль" сотен миллионов (в пределе - миллиарда (золотого) людей).

>2. Технологии. Они еще и близко не подошли к он-лайн распознаванию речи и видео. Да "теоретически это так" и существуют демонстраторы технологий. Практически это требует тонких индивидуальных настроек и работает на множестве десятков-сотен объектов.
Именно, что уже подошли близко. Системы распознавания лиц в толпе уже опробованы на тестовых случаях и готовятся к сугубо утилитарному использованию - например, для выщемления нежелательных посетителей в казино - и, по всей вероятности, будут внедрены в ближайшие годы.

>Не работает уже на десятках тысяч. См. п.1 про миллиард.
>С поправкой на различные диалекты, фефекты фикции и сложную помеховую обстановку.
>Тут ограничения носят уже даже не технологический, а как бы не физический характер.

>3. Существующие национальные и административные организационные разделения.
>даже абстрагируясь от пп 1 и 2 - организация такого контроля означает, что все ведомства делятся между собой информацией (или сливают ее в некий единый ЦОД). При этом все государства тоже делятся между собой этой информацией и сливают ее в единый ЦОД - все это работает на единых стандартах и форматах и по единым алгоритмам.
>На текущем этапе построения общества, цивилизации это невозможно. Следовательно можно говорить разве что о каком то крайне отдаленой перспективе - а про нее можно вообразить все что угодно, в т.ч. бессмертие и неисчерпаемые источники энергии :)
Про "все государства" - это ты с кем-то другим споришь, не со мной. В рамках де одного государства, либо государства с блоком союзников - вполне.
Да, что немаловажно, реальность, данная нам в ощущениях, такова, что значительную долю информации, попадание которой в третьи руки может поставить под угрозу личную жизнь пользователей, контролируется негосударственными организациями - Майкрософт, Эппл, Гугл...

>4. Тоже немаловажное.
>Подобная система "анализа и мониторинга инцидентов" она на самом деле ничего не автоматизирует, как это не покажется странным.
>Она создает колоссальный поток _новых_ задач для спецслужб. Даже ты сам пытался по ветке показать, что "отклонения от паттерна2 требуют реакции. И это тоже интересный момент - если человек автоматически не сажается в тюрьму или не эвтаназируется :) то "реагирование" требует отработки живыми людьми - сотрудниками спецслужб. Профилактики ли, дополнительной слежки и т.д. - вобщем мероприятий по "закрытию тикета".
То, что информация сразу представлена в цифровой форме дает возможность ее статистического анализа. Не "Ходит на Кавказ.орг, ездит в Египте и смотрел на ЮТубе инструкцию по изготовлению аммонала" - подозрителен! Проверить!", а "12.8% граждан, которые ходили, ездили и смотрели участвовали в совершении либо пособничестве теракту в течение года с момента просмотра инструкции". Что позволит использовать принципиально ограниченные ресурсы спецслужб более, а не менее эффективно.

С уважением, Dargot.

От Дмитрий Козырев
К Dargot (16.10.2013 15:48:45)
Дата 16.10.2013 16:17:03

Re: Это деспотия

> Именно потому, что "небольшие корпорации" пытаются значительную часть функций осуществлять руками - это раз.

Фрилансер? :) Напротив объем задач корпораций требует высокой их автоматизации.

>И два - внедрение многих новшеств, типа того же распознавания лиц, в масштабах корпорации не имеет смысла - проще осуществить пропуск работников по карточкам.

У тебя какое то ограниченное воображение зачем нужно распознавание лиц. Я совершено о другом - я ровно о том, что даже небольшие объемы анализа уже существующие показывают технологическую предельность доступных ресурсов - а их требуется увеличивать не просто на порядки, а на многие порядки.


>Эффект масштаба он и в обратном направлении работает - Интернет - нечто качественно большее, чем "соединенные друг с другом компьютеры".

не понял существо этого аргумента.

> Распознавание всех лиц на всех камерах наблюдения даст качественно новые возможности по сравнению с распознаванием лиц на одной камере - например, выстраивание харакетрных маршрутов движения граждан и их статистический анализ.

ты опять не о том. В этом пункте я говорю о том, что прежде чем перейти к анализу - нужно обеспечить сбор и систематизацию (пригодность и доступность для анализа) хреналионного объема сырых данных.
Ты знаешь сколько занимает запись видео на единицу времени? в разрешении чтобы надежно распознавалось лицо (ну или фигура), чтобы не было пропусков за счет сокращения числа кадров? А перемножить это на число камер работающих в режиме 24х7? А выстроит на все это дело индексы?

>>2. Технологии. Они еще и близко не подошли к он-лайн распознаванию речи и видео. Да "теоретически это так" и существуют демонстраторы технологий. Практически это требует тонких индивидуальных настроек и работает на множестве десятков-сотен объектов.
> Именно, что уже подошли близко. Системы распознавания лиц в толпе уже опробованы на тестовых случаях и готовятся к сугубо утилитарному использованию - например, для выщемления нежелательных посетителей в казино - и, по всей вероятности, будут внедрены в ближайшие годы.

... работает на множестве десятков-сотен объектов.
:)))


>>На текущем этапе построения общества, цивилизации это невозможно. Следовательно можно говорить разве что о каком то крайне отдаленой перспективе - а про нее можно вообразить все что угодно, в т.ч. бессмертие и неисчерпаемые источники энергии :)
> Про "все государства" - это ты с кем-то другим споришь, не со мной.

Возможно. Просто в ветке отрицалось возможнось покупки сим-карты в другой стране, чтобы об этом не стало известно в стране резидента.

> Да, что немаловажно, реальность, данная нам в ощущениях, такова, что значительную долю информации, попадание которой в третьи руки может поставить под угрозу личную жизнь пользователей, контролируется негосударственными организациями - Майкрософт, Эппл, Гугл...

это не значительная доля информации.

> То, что информация сразу представлена в цифровой форме дает возможность ее статистического анализа.

Ты опять не понял. Ну дает и что? Что делать с результатом этого анализа?

>Не "Ходит на Кавказ.орг, ездит в Египте и смотрел на ЮТубе инструкцию по изготовлению аммонала" - подозрителен! Проверить!",

Ну да 10 тыс "подозрительных событий" ежедневно на 100 проверяльщиков работающих по 8 часов...
Дальше продолжать?
Чтоб было понятно напомню фильм "Брюс всемогущий" где он в режиме бога получал по е-мейлу просьбы молящихся :)
И обязан был на них "реагировать".
Чем все кончилось ? - правильно - select all - "удовлетворить" :))

От Dargot
К Дмитрий Козырев (16.10.2013 16:17:03)
Дата 16.10.2013 17:35:22

Re: Это деспотия

Приветствую!

>Фрилансер? :)
Отнюдь.

>Напротив объем задач корпораций требует высокой их автоматизации.
Функций по контролю, я имею в виду.

>>И два - внедрение многих новшеств, типа того же распознавания лиц, в масштабах корпорации не имеет смысла - проще осуществить пропуск работников по карточкам.
>
>У тебя какое то ограниченное воображение зачем нужно распознавание лиц. Я совершено о другом - я ровно о том, что даже небольшие объемы анализа уже существующие показывают технологическую предельность доступных ресурсов - а их требуется увеличивать не просто на порядки, а на многие порядки.
"Объем анализа" чего? А то, извини, можно из того, что поиск оптимального решения задачи коммивояжера для жалких 50 городов - задача неподъемная, сделать вывод, что вообще все методы оптимизации - фу и бесполезны. Однако, это будет неправильно.

>>Эффект масштаба он и в обратном направлении работает - Интернет - нечто качественно большее, чем "соединенные друг с другом компьютеры".
>не понял существо этого аргумента.

Это к возражениям в стиле: "А я спрячусь от камеры", "Иногда камеры бьют", "Телефон не всегда работает" и пр.

>> Распознавание всех лиц на всех камерах наблюдения даст качественно новые возможности по сравнению с распознаванием лиц на одной камере - например, выстраивание харакетрных маршрутов движения граждан и их статистический анализ.
>
>ты опять не о том. В этом пункте я говорю о том, что прежде чем перейти к анализу - нужно обеспечить сбор и систематизацию (пригодность и доступность для анализа) хреналионного объема сырых данных.
>Ты знаешь сколько занимает запись видео на единицу времени? в разрешении чтобы надежно распознавалось лицо (ну или фигура), чтобы не было пропусков за счет сокращения числа кадров?
Как раз количество кадров не так важно, мы же не кино показываем. Достаточно нескольких в секунду максимум.
Оценим так. Пусть 1 камера генерирует в сутки 1 гигабайт видео (с учетом малой частоты кадров).

> А перемножить это на число камер работающих в режиме 24х7? А выстроит на все это дело индексы?
Количество камер в Великобритании оценивается в 4-6 миллионов. Пусть 5 миллионов.
Все камеры всей Великобритании генерируют 5 петабайт в сутки. Это много, да. 2.5 Рутрекера в день, 0.2 дневного потока данных через сервера гугла.

Однако:
1) В первом приближении сырое видео можно хранить только на локальных серверах какое-то время (как оно сейчас, собственно, и делается). А "наверх" для анализа отсылать только уже обработанные и почищенные данные - лица людей, номера машин.

2) Конкретно для сжатия видео камер наблюдения, которые большую часть времени показывают одно и то же, могут и должны использоваться специфические алгоритмы сжатия. 24 часа видео камеры - это не 12 художественных фильмов.

3) Ты сам сказал - экспонента.

>>>2. Технологии. Они еще и близко не подошли к он-лайн распознаванию речи и видео. Да "теоретически это так" и существуют демонстраторы технологий. Практически это требует тонких индивидуальных настроек и работает на множестве десятков-сотен объектов.
>> Именно, что уже подошли близко. Системы распознавания лиц в толпе уже опробованы на тестовых случаях и готовятся к сугубо утилитарному использованию - например, для выщемления нежелательных посетителей в казино - и, по всей вероятности, будут внедрены в ближайшие годы.
>
>... работает на множестве десятков-сотен объектов.
В день под камерами казино проходит отнюдь не сотня людей.

>> Да, что немаловажно, реальность, данная нам в ощущениях, такова, что значительную долю информации, попадание которой в третьи руки может поставить под угрозу личную жизнь пользователей, контролируется негосударственными организациями - Майкрософт, Эппл, Гугл...
>это не значительная доля информации.
Значительная-значительная. Электронная переписка, разговоры по скайпу, контакты в социальных сетях.

>> То, что информация сразу представлена в цифровой форме дает возможность ее статистического анализа.
>
>Ты опять не понял. Ну дает и что? Что делать с результатом этого анализа?

>>Не "Ходит на Кавказ.орг, ездит в Египте и смотрел на ЮТубе инструкцию по изготовлению аммонала" - подозрителен! Проверить!",
>Ну да 10 тыс "подозрительных событий" ежедневно на 100 проверяльщиков работающих по 8 часов...
Я специально отмел этот пример как плохой - а ты мне его и приводишь. Это специально или по невнимательности?
Еще раз, на пальцах. В отличие от принципиально нечетких и неформализуемых критериев, применяемых сейчас, для некоего паттерна поведения мы можем точно сказать, с какой надежностью следование ему характеризует пациента как нежелательный элемент. 1%, 30%, 90%... Последних не надо проверять, надо сразу арестовывать.
Знаешь, это как сейчас в США маньяков ловят. Все вот эти: "Преступник, скорее всего, белый мужчина, безработный или на частичном заработке, ездит на большой черной машине и т.д. и т.п.". Немалая часть этих ориентировок - не умозаключения психологов, а банальная статистика, собранная вручную из накопившейся за десятки лет базы преступников. Начинались эти изыскания еще в докомпьютерные времена.
Я предлагаю собирать эту статистику в автоматическом режиме и сразу с определением доверительной вероятности.

С уважением, Dargot.

От Дмитрий Козырев
К Dargot (16.10.2013 17:35:22)
Дата 16.10.2013 18:04:13

Re: Это деспотия

>>Напротив объем задач корпораций требует высокой их автоматизации.
> Функций по контролю, я имею в виду.

и функций по контролю - тоже.

>>У тебя какое то ограниченное воображение зачем нужно распознавание лиц. Я совершено о другом - я ровно о том, что даже небольшие объемы анализа уже существующие показывают технологическую предельность доступных ресурсов - а их требуется увеличивать не просто на порядки, а на многие порядки.
> "Объем анализа" чего?

Информации, собранной от детекторов.

>А то, извини, можно из того, что поиск оптимального решения задачи коммивояжера для жалких 50 городов - задача неподъемная, сделать вывод, что вообще все методы оптимизации - фу и бесполезны. Однако, это будет неправильно.

Я не понял к чему этот аргумент. У этой задачи минимальный набор входных данных. Хдесь весь вопрос только в ее алгоритмизации.

>>>Эффект масштаба он и в обратном направлении работает - Интернет - нечто качественно большее, чем "соединенные друг с другом компьютеры".
>>не понял существо этого аргумента.
>
> Это к возражениям в стиле: "А я спрячусь от камеры", "Иногда камеры бьют", "Телефон не всегда работает" и пр.

В упрощенном виде это действительно так. Естественое поведение людей - примеры которого приводятся препятсвует их достоверной верификации или (в соответсвии с твоими преждложениями) создает сврехпоток "инцидентов", по которым требуется принятие решения человеком.

>>ты опять не о том. В этом пункте я говорю о том, что прежде чем перейти к анализу - нужно обеспечить сбор и систематизацию (пригодность и доступность для анализа) хреналионного объема сырых данных.
>>Ты знаешь сколько занимает запись видео на единицу времени? в разрешении чтобы надежно распознавалось лицо (ну или фигура), чтобы не было пропусков за счет сокращения числа кадров?
> Как раз количество кадров не так важно, мы же не кино показываем. Достаточно нескольких в секунду максимум.

ага, сразу видно, что с видео с камер наблюдения ты не работал и с ситуациями "в этом кадре половина фигуры входит, а в следующем половина фигуры выходит" ты не сталкивался.

> Оценим так. Пусть 1 камера генерирует в сутки 1 гигабайт видео (с учетом малой частоты кадров).

я даже тебя обрадую - в 2-3 раза меньше.

>> А перемножить это на число камер работающих в режиме 24х7? А выстроит на все это дело индексы?
> Количество камер в Великобритании оценивается в 4-6 миллионов. Пусть 5 миллионов.
> Все камеры всей Великобритании генерируют 5 петабайт в сутки. Это много, да. 2.5 Рутрекера в день, 0.2 дневного потока данных через сервера гугла.

Это не "поток"! Его нужно не "пропустить", а записать, проиндексировать, закешировать! О чем и речь - нужен гугл на среднее административное образование (и это только по видео!) - хотя ты сам говоришь что камер надо больше, в разы если не на порядок.

> Однако:
>1) В первом приближении сырое видео можно хранить только на локальных серверах какое-то время (как оно сейчас, собственно, и делается). А "наверх" для анализа отсылать только уже обработанные и почищенные данные - лица людей, номера машин.

>2) Конкретно для сжатия видео камер наблюдения, которые большую часть времени показывают одно и то же, могут и должны использоваться специфические алгоритмы сжатия.

детекторы движения там используются - запись по факту изменения картинки, но это вырожденный случай - тебя же интересует тотальный контроль перемещений - значит в режиме 24х7 надо писать городские площади, переходы метро, с разных ракурсов чтобы видеть лица.
Кстати а в дождь оно работает? когда люди идут под зонтами :)))

>3) Ты сам сказал - экспонента.

ты сам сказал "удваивается каждый год", я принял на веру.

>>... работает на множестве десятков-сотен объектов.
> В день под камерами казино проходит отнюдь не сотня людей.

не думаю чт одаже крупные казино имеют больше сотЕН посетителей в день.
И потом тут то задача другая им надо сопоставить паттерну подозрительного со всеми входящими.
Явное несовпадение - отбрасывается, на сходство - сигнал охране. простейший алгортм.
В твоем случае надо _верифицировать_ _каждого_ попавшего в объектив. Т.е. записать лицо, запросить "ценральную базу данны" и решить задачу распознавание образов _над ВСЕЙ_ базой.

>>> Да, что немаловажно, реальность, данная нам в ощущениях, такова, что значительную долю информации, попадание которой в третьи руки может поставить под угрозу личную жизнь пользователей, контролируется негосударственными организациями - Майкрософт, Эппл, Гугл...
>>это не значительная доля информации.
> Значительная-значительная. Электронная переписка, разговоры по скайпу, контакты в социальных сетях.

Это не значительная доля информации. Хотя да, позволяет таргетировать рекламу.

> Еще раз, на пальцах. В отличие от принципиально нечетких и неформализуемых критериев, применяемых сейчас, для некоего паттерна поведения мы можем точно сказать, с какой надежностью следование ему характеризует пациента как нежелательный элемент. 1%, 30%, 90%... Последних не надо проверять, надо сразу арестовывать.

Если человек настолько глуп что своей сетевой деятельностью набрал себе на состав по УК то он сам себе злобный буратино.
Я же говорю как раз о тех случаях которые "требуют дополнительной проверки".

> Я предлагаю собирать эту статистику в автоматическом режиме и сразу с определением доверительной вероятности.

ее и сейчас можно собрать.
Ты говоришь на мой взгляд о другом.
Для попадания в аналитику органов - нужно сначала привлечь к себе внимание этих органов каким то явным криминалом "встать на учет".
ты же сейчас говоришь об обратном - о том что "тотальный контроль" позволит "ставить на учет" в автоматическом режиме - иначе все эти меры лишены смысла при неэпических затратах.

От Dargot
К Дмитрий Козырев (16.10.2013 18:04:13)
Дата 16.10.2013 18:51:51

Re: Это деспотия

Приветствую!

>>>Напротив объем задач корпораций требует высокой их автоматизации.
>> Функций по контролю, я имею в виду.
>и функций по контролю - тоже.
А функции по контролю в масштабах компании автоматизировать мало смысла.
Ну например, то же распознавание лиц на камерах. Зачем оно в компании?

>>>У тебя какое то ограниченное воображение зачем нужно распознавание лиц. Я совершено о другом - я ровно о том, что даже небольшие объемы анализа уже существующие показывают технологическую предельность доступных ресурсов - а их требуется увеличивать не просто на порядки, а на многие порядки.
>> "Объем анализа" чего?
>Информации, собранной от детекторов.
Какой информации? Порядка петабайта в год, ЕМНИП, генерит БАК - а получаемая от него информация вполне анализируется, причем, грубо говоря, одним суперкомпьютером, а не сетью раскиданных по всей стране вычислительных мощностей разного уровня.

>>>>Эффект масштаба он и в обратном направлении работает - Интернет - нечто качественно большее, чем "соединенные друг с другом компьютеры".
>>>не понял существо этого аргумента.
>> Это к возражениям в стиле: "А я спрячусь от камеры", "Иногда камеры бьют", "Телефон не всегда работает" и пр.
>
>В упрощенном виде это действительно так. Естественое поведение людей - примеры которого приводятся препятсвует их достоверной верификации или (в соответсвии с твоими преждложениями) создает сврехпоток "инцидентов", по которым требуется принятие решения человеком.
То, что некоторые ездят с грязными номерами - а некоторые специально их пачкают - не отменяет идеи автомобильных номеров.

>>>ты опять не о том. В этом пункте я говорю о том, что прежде чем перейти к анализу - нужно обеспечить сбор и систематизацию (пригодность и доступность для анализа) хреналионного объема сырых данных.
>>>Ты знаешь сколько занимает запись видео на единицу времени? в разрешении чтобы надежно распознавалось лицо (ну или фигура), чтобы не было пропусков за счет сокращения числа кадров?
>> Как раз количество кадров не так важно, мы же не кино показываем. Достаточно нескольких в секунду максимум.
>ага, сразу видно, что с видео с камер наблюдения ты не работал и с ситуациями "в этом кадре половина фигуры входит, а в следующем половина фигуры выходит" ты не сталкивался.
Когда камер много - ничего страшного. На эту не войдет - на другую попадется.

>> Оценим так. Пусть 1 камера генерирует в сутки 1 гигабайт видео (с учетом малой частоты кадров).
>я даже тебя обрадую - в 2-3 раза меньше.
Это неважно, нам же порядок определить.

>>> А перемножить это на число камер работающих в режиме 24х7? А выстроит на все это дело индексы?
>> Количество камер в Великобритании оценивается в 4-6 миллионов. Пусть 5 миллионов.
>> Все камеры всей Великобритании генерируют 5 петабайт в сутки. Это много, да. 2.5 Рутрекера в день, 0.2 дневного потока данных через сервера гугла.
>
>Это не "поток"! Его нужно не "пропустить", а записать, проиндексировать, закешировать! О чем и речь - нужен гугл на среднее административное образование (и это только по видео!) - хотя ты сам говоришь что камер надо больше, в разы если не на порядок.

Я не вижу, что тут страшного. Мы же не гоним весь этот поток в один центр по одному каналу.
Пусть цифровой "паспорт" лица состаляет 1 кБайт (на самом деле - меньше, думаю). Пусть в мы хотим хранить 100 миллионов лиц на всю Британию. 100гБайт данных, вообще ни о чем. 100 миллионов записей. Это не очень большая БД, которую можно тупо раскопировать по всей стране на каждый сервер, контролирующий десяток-другой камер и раз в сутки апдейтить. Запросов к ней будет тоже не очень много - не так много лиц в секунду каждая камера видит.

>детекторы движения там используются - запись по факту изменения картинки, но это вырожденный случай - тебя же интересует тотальный контроль перемещений - значит в режиме 24х7 надо писать городские площади, переходы метро, с разных ракурсов чтобы видеть лица.
Детекторы движений - само собой, но я конкретно об алгоритмах зжатия типа H.264.

>Кстати а в дождь оно работает? когда люди идут под зонтами :)))
В метро и автобусе - да:)

>не думаю чт одаже крупные казино имеют больше сотЕН посетителей в день.
>И потом тут то задача другая им надо сопоставить паттерну подозрительного со всеми входящими.
>Явное несовпадение - отбрасывается, на сходство - сигнал охране. простейший алгортм.
>В твоем случае надо _верифицировать_ _каждого_ попавшего в объектив. Т.е. записать лицо, запросить "ценральную базу данны" и решить задачу распознавание образов _над ВСЕЙ_ базой.
См. выше. На каждом локальном сервере будет не больше нескольких десятков запросов в секунду.

>>>> Да, что немаловажно, реальность, данная нам в ощущениях, такова, что значительную долю информации, попадание которой в третьи руки может поставить под угрозу личную жизнь пользователей, контролируется негосударственными организациями - Майкрософт, Эппл, Гугл...
>>>это не значительная доля информации.
>> Значительная-значительная. Электронная переписка, разговоры по скайпу, контакты в социальных сетях.
>Это не значительная доля информации. Хотя да, позволяет таргетировать рекламу.
Может, в твоей терминологии, личная переписка не является значительным куском личной информации - но в моей является:)

>> Еще раз, на пальцах. В отличие от принципиально нечетких и неформализуемых критериев, применяемых сейчас, для некоего паттерна поведения мы можем точно сказать, с какой надежностью следование ему характеризует пациента как нежелательный элемент. 1%, 30%, 90%... Последних не надо проверять, надо сразу арестовывать.
>Если человек настолько глуп что своей сетевой деятельностью набрал себе на состав по УК то он сам себе злобный буратино.
Ну, народу и такие примеры известны.
Однако же, речь идет не о "набрал на состав по УК", когда пишущий книжку про бандитов ВНЕЗАПНО оказывается под следствием как бандит. Речь идет о выявлении соответствия паттернов безобидных в отдельности действий - посещений сайтов, перемещений, телефонных звонков, социальных контактов и пр. противоправному поведению.

>> Я предлагаю собирать эту статистику в автоматическом режиме и сразу с определением доверительной вероятности.
>ее и сейчас можно собрать.
Сейчас не так много информации для анализа.

>Ты говоришь на мой взгляд о другом.
>Для попадания в аналитику органов - нужно сначала привлечь к себе внимание этих органов каким то явным криминалом "встать на учет".
>ты же сейчас говоришь об обратном - о том что "тотальный контроль" позволит "ставить на учет" в автоматическом режиме - иначе все эти меры лишены смысла при неэпических затратах.
Именно.

С уважением, Dargot.

От Дмитрий Козырев
К Dargot (16.10.2013 18:51:51)
Дата 16.10.2013 21:22:20

Re: Это деспотия


>>>>Напротив объем задач корпораций требует высокой их автоматизации.
>>> Функций по контролю, я имею в виду.
>>и функций по контролю - тоже.
> А функции по контролю в масштабах компании автоматизировать мало смысла.

ну как же мало-то? Сейчас целая масса стандартов по информационной безопасности требует функций контроля и если их не автоматизировать - никакого персонала не напасешься.

> Ну например, то же распознавание лиц на камерах. Зачем оно в компании?

например для физического контроля доступа в защищенные зоны производства или к критичному оборудованию.
Разного рода смарткарты невполне подходят - сотрудники склонны передавать их друг другу. нужна биометрия.
Есть изуверы контролирующие присутсвие на рабочих местах - пока правда обходятся радиометками - но опять же не существует прямой связи между ней и человеком.


>>> "Объем анализа" чего?
>>Информации, собранной от детекторов.
> Какой информации?

о которой ты говоришь - распознавание изображений в онлайн, их корреляция с данными мобильных операторов, перемещением автомобиля, посещаемостью и активностью в сети, связями с другими людьми и их поведением.



>>> Это к возражениям в стиле: "А я спрячусь от камеры", "Иногда камеры бьют", "Телефон не всегда работает" и пр.
>>
>>В упрощенном виде это действительно так. Естественое поведение людей - примеры которого приводятся препятсвует их достоверной верификации или (в соответсвии с твоими преждложениями) создает сврехпоток "инцидентов", по которым требуется принятие решения человеком.
> То, что некоторые ездят с грязными номерами - а некоторые специально их пачкают - не отменяет идеи автомобильных номеров.

идея паспортов тоже существует давно.
Речь идет про тотальный онлайн контроль.
Такой контроль номеров автомашин с помощью камер стал возможен сравнительно недавно. И то там используется распознавание ограниченного набора стандартных символов, в опредленной точке пространства.
И то это сразу столкнулось с целым набором методов противодействия.
Ты же предлагаешь распознавать лицо, объект априори нечеткий, многообразный, имеющий совпадения (двойники и близнецы), находящийся под произвольным углом к камере (голова подвижна), скрываемый даже неумышленно очками или элементами одежды, подверженный изменениям ((не)бритье, косметология, биологические изменения, травмы).


>>> Как раз количество кадров не так важно, мы же не кино показываем. Достаточно нескольких в секунду максимум.
>>ага, сразу видно, что с видео с камер наблюдения ты не работал и с ситуациями "в этом кадре половина фигуры входит, а в следующем половина фигуры выходит" ты не сталкивался.
> Когда камер много - ничего страшного. На эту не войдет - на другую попадется.

А в чем смысл контроля если между фиксацией соседних камер будет несколько часов?



>>Это не "поток"! Его нужно не "пропустить", а записать, проиндексировать, закешировать! О чем и речь - нужен гугл на среднее административное образование (и это только по видео!) - хотя ты сам говоришь что камер надо больше, в разы если не на порядок.
>
> Я не вижу, что тут страшного. Мы же не гоним весь этот поток в один центр по одному каналу.

То есть как? Обязан гнать - каждая камера каждое лицо должна гнать в центр.

> Пусть цифровой "паспорт" лица состаляет 1 кБайт (на самом деле - меньше, думаю).

Чтоты собираешься распознать по изображению в 1 К? :)



>>Кстати а в дождь оно работает? когда люди идут под зонтами :)))
> В метро и автобусе - да:)

Там люди спят подняв воротник и натянув капюшон :)))

>>В твоем случае надо _верифицировать_ _каждого_ попавшего в объектив. Т.е. записать лицо, запросить "ценральную базу данны" и решить задачу распознавание образов _над ВСЕЙ_ базой.
> См. выше. На каждом локальном сервере будет не больше нескольких десятков запросов в секунду.

Тогда ты не учитываешь "стоимость владения" такой системой. Сколько нужно админов на поддержку - чтобы делать регулярные процедуры. апддейты и т.п (это тоже можно просчитать по ИТИЛ :)


>>> Значительная-значительная. Электронная переписка, разговоры по скайпу, контакты в социальных сетях.
>>Это не значительная доля информации. Хотя да, позволяет таргетировать рекламу.
> Может, в твоей терминологии, личная переписка не является значительным куском личной информации - но в моей является:)

Видишь ли цифровая диктатура невозможна без диктатру обычной, государственной. Т.е. когда государство активно вмешивается в личную и общественную жизнь, устанавливает свои нормы и правила и применяет репрессалии к нарушителям.
Т.е. в этой перписке должно быть нечто противозаконное, чтобы посик его с такой затратой ресурсов был оправдан.
Ну и что это у тебя? :)


>>Если человек настолько глуп что своей сетевой деятельностью набрал себе на состав по УК то он сам себе злобный буратино.
> Ну, народу и такие примеры известны.
> Однако же, речь идет не о "набрал на состав по УК", когда пишущий книжку про бандитов ВНЕЗАПНО оказывается под следствием как бандит. Речь идет о выявлении соответствия паттернов безобидных в отдельности действий - посещений сайтов, перемещений, телефонных звонков, социальных контактов и пр. противоправному поведению.

Можно это как то поконкретнее изложить. Вот человек регулярно читает экстремизм и ходит в стрелковый клуб.
Вот это установлено - что дальше?

>>> Я предлагаю собирать эту статистику в автоматическом режиме и сразу с определением доверительной вероятности.
>>ее и сейчас можно собрать.
> Сейчас не так много информации для анализа.

Но и не мало.
Просто в большинтсве случаев это пустышка, не представляющая интереса с одной стороны или тщательно скрываемая с другой.
И твои страхи состоят в том, что бы для самоцели реализовать космическую программу. Удовлетворить свое любопытсво :)

>>Ты говоришь на мой взгляд о другом.
>>Для попадания в аналитику органов - нужно сначала привлечь к себе внимание этих органов каким то явным криминалом "встать на учет".
>>ты же сейчас говоришь об обратном - о том что "тотальный контроль" позволит "ставить на учет" в автоматическом режиме - иначе все эти меры лишены смысла при неэпических затратах.
> Именно.

Что "именно". Я об этом уже писал.
10 тыс срабатываний в день на 100 "контролеров" - и что им с этим делать?
А завтра еще +10 тыс.