#UDM25_0 01 ЧИСТЫЕ И ГРЯЗНЫЕ ДАННЫЕ, Вступление - Игорь Третьяков

Начните писать здесь...

Зеркало
Rutube

Этот доклад 
Дублирующий канал на Российской видеохплатформе.

Группа VK ВКонтакте

 Этот доклад
Группа #UDM в социальной сети с дублями видео и комментариями.

#UDM на в/х
Платформа

Этот доклад
Доклады Уральского Клуба Цифровизации на видеохостинге

.

Расшифровка видео:

Мое почтение, Дамы и Господа!

Сейчас принято на мероприятиях, типа давайте 5 минут подождем, но я за пунктуальность. Давайте будем хоть иногда вести себя как взрослые. Во-первых, я хочу поблагодарить тех, кто пришел. Для меня конференция — это очень важное мероприятие. Это тот день, когда я честно работаю на тех людей, кого я уважаю, и чье мнение для меня ценно.


00:28

Может быть самое важное, что они готовы прийти ответить на вопросы. Есть множество записей, в том числе и для конференции, записи -  это вторично, потому что возможность задать вопросы. То есть то, что прямо сейчас может привести к росту, или то, что прямо сейчас беспокоит или хочется реализовать.


00:58

докладов, за то, как они доносят это и все ли красиво, все ли понятно, но самое главное, если человек готов выйти в круг, если человек готов ответить на вопросы, это уже характеризует, о чем он говорит. Вряд ли на внедрении будет пунктуальным тот человек, который не может даже навести порядок своей презентации, а потом он говорит, дай мне кучу миллионов,


01:28

я тебе поставлю суперсистему. И сегодня мы выбрали как магистральную тему по данным. Именно о том, что информация является ключом к предприятию, к его развитию. Это даже не кровь, это нерв. Это нервная система всего предприятия. Как у вас проходит информация, так вы и взаимодействуете.


01:59

где информация ходит очень-очень медленно, и они не успевают реагировать на изменение обстановки. Какие-то предприятия вообще не совсем здоровы, и у них часть информации приходит не туда, либо теряется. Какие-то информационно избыточные. Сейчас вообще пошёл маятник в другую сторону. Когда-то мы жили в дефиците информации. То есть я...


02:26

работал и в дефиците информации, когда книжки надо было распечатывать, а для этого надо было еще сэкономить, либо выпросить у начальника бумаги, чтобы распечатать нужную книгу. Когда файлами делились, еще даже флешек не было. Были, но они были размером с чемоданом. И сейчас скорее избыток информации. Люди и корпорации живут в таком потоке вот этой информации, но качество этой данных очень... качество этой информации...


02:55

сильно снизилась. И если словом прошлого года был кибершторм, и может быть на этом не надо тратить время, потому что всем очевидно. У нас 20 декабря только что выступал Андрей Геннадьевич Ионин и говорил о том, что мы не отрефлексировали глобальный сбой Винды, как после Нового года мы увидели о том, что интернет может лечь сразу весь пускай ненадолго.


03:23

но это был такой звоночек. И в этой реальности нам надо жить. То я думаю, что следующим словом года будет смерть экспертизы. Потому что качество информации и снаружи, и внутри предприятия очень сильно деградирует. И с этим надо что-то делать. В том числе, вовремя началась дискуссия о том, как внедрить планировщик.


03:49

Все хотят планировщик, и самое смешное, пришли люди и говорят дайте нам планировщик из коробки. Так вот, чтобы предприятие работало, в первую очередь нужны достоверные данные, нужны корректные данные, нужны данные в реальном времени, нужны данные, которым можно доверять, нужны данные, которым можно подтвердить или валидировать их актуальность, ну и нужны люди, которые умеют в эти данные, которые понимают зачем эти показатели на дашбордах, которые умеют выявлять.


04:19

нужные данные, превращать их в информацию. То есть какие конкретно ситуации, о чем это говорит, что же на самом деле произошло, о чем это свидетельствует, ну и куда все это катится. Здесь, что важно для информационных систем предприятий, что был такой тренд собирать даталейки и что сейчас мы, Big Data нам, нас спасет. То есть был хайп, был тренд.


04:44

который куда-то тихо сдулся. Все строили громадные дата-центры, и данные — это новая нефть, но что-то она не сильно летает. Потому что еще данные надо вычленить из них достоверные, потом определить важные от неважных, потому что не все можно переварить, никаких ресурсов не хватит, электричества на планете. И оперировать какими-то уже сущностями, понятиями, событиями, документами, состояниями.


05:14

производственная система для того, чтобы ей можно было реально управлять. Тема искусственного интеллекта и о том, что сейчас все будет совсем плохо, потому что одновременно идут два тренда. То есть цифровые советчики стали доступны даже для малого бизнеса и доступ к сервисам искусственного интеллекта и свой карманный искусственный интеллект. Он стал бытовой темой,


05:43

во многих крупных системах есть капилоты, и есть сборки, которые позволяют самому себе быстренько прикрутить свой искусственный интеллект. С другой стороны, мы не до конца понимаем ту опасность, которую это несет, и то, что за это никто не хочет отвечать. Но это более подробно. Кроме того, информация не только дает нам возможности, а создает новые уязвимости. И с этим надо тоже как-то жить.


06:10

и кибербезопасность это уже не про каких-то там черных-белых хакеров, которые между собой как-то разбираются, и антивирус, который надо поставить. Это какое-то другое взаимодействие в этой среде, когда стало много автомобилей, и в конце концов большинство населения умеет водить, умеет соблюдать правила дорожного движения, более-менее знает, где припарковаться, более-менее смирилась с тем, когда машины вывозят эвакуаторы.


06:37

понимает, что надо платить за страховку, бензин и так дальше, некоторые даже с удовольствием моют свою машину. Кто-то передавая на оутсорс, кто-то делает это самостоятельно. Ну и то, что мы должны в первую очередь наладить информационные потоки на предприятие. Метки экспертизы мы обсудим отдельно. А сейчас я бы хотел теорию, которую может быть не все любят, но без практики теория мертва, это правда.


07:07

А с другой стороны, если ты знаешь несколько правил, это избавит тебя от необходимости знать множество кейсов. Итак, что же я считаю важным и даже обязательным? Потому что мне удалось очно прочитать курс о информационным потокам. Самой ввиняемой частью было предприятие. Несколько удивительно для меня, но приятно было увидеть.


07:31

тех, кто понимает, что это важно, тех, кто знает, как это практически применить и так дальше, то есть во всей цепочке предприятия, эксперты, преподаватели, учебные заведения, интеграторы, вендоры, предприятия оказались самой вменяемой частью. Поэтому сейчас только то, что обязательно, потому что в конце того семинара вывод был единственный, что эту тему надо выводить отдельно.


08:00

и чуть ли там кто-то требовал двухнедельный курс сделать только по информационным потокам. Итак, моя любимая схема. Я рисую предприятие в таком виде. И в первую очередь нам нужно в каком-то виде отфиксировать, что мы пообещали заказчику. Но для начала нам надо понимать, что этот заказчик хочет. Начиная от капиллота в битриксе, который нам...


08:25

уже сильно помогает, потому что сам заполняет формы, то есть переводит разговор менеджера с клиентом в машину, читаемые формы. Это, конечно, большой прогресс, а сильно экономит трудоемкость. Но как проверить, что тот самый искусственный интеллект не потерял ничего важного? Как выявить важные критерии для заказчика? Как сразу определить, сильно ли они повлияют на нашу себестоимость?


08:55

И в том числе кто-то использовал это для прорыва. Конфигураторы сейчас очень модная тема, очень перспективная. И дает очень большой рост и в скорости производства, и в удовлетворении заказчиков, и во многом чем еще. Но иногда мы не до конца понимаем, что же хочет заказчик и чем это отличается.


09:22

как это влияет на наше производство. То есть бывает для заказчика что-то важно, и нам это легко сделать, а мы не можем. С другой стороны, бывает заказчику кажется, что это просто, а это вынуждает нас перестраивать все планы, процессы и так дальше, следовательно, приводит к удорожанию продукта. И мы видим одновременно два тренда. Первый, то, что идет упрощение и коммодитизация всего от смартфона до жилых домов.


09:51

а с другой стороны, что цифра позволяет делать кастомные изделия по цене практически серийных, если к ней правильно подойти. Поэтому это первый важный этап на входе в производственную систему, то что раньше считалось только отделом сбыта, то есть они продали и нам сказали сколько и кому отправить, то теперь начинает от того, что заказчик хочет сразу увидеть сроки производства и сроки


10:21

С другой стороны, должны отфиксировать, правильно ли мы понимаем, что же мы наобещали. Это будет опорой и нашего планирования, и управления поставками, и распределения ресурсов, и то, что мы отдадим на outsource, либо будем делать самостоятельно. Потом, естественно, мы должны сделать технологическое обеспечение, инженерную часть и производственную часть. И как-то ее оцифровать. Не важно, собственно, с производства, а outsource-ная.


10:50

либо мы размещаем где-то заказы, дайр-это-маркет, модное слово. Мы должны понимать, что нужно сделать для того, чтобы было наше изделие, то есть управлять составом изделия, либо рецептурой. Состав изделия для дискретного производства – это очень важный вопрос, до какой части разузловывать. Кто-то пытается делать все самостоятельно, кто-то пытается максимально использовать готовые узлы, но попадает в зависимость от поставщиков.


11:20

Сейчас это проблема практически всей отрасли, что китайцы нам обещают готовую фару, готовую продать дешевле, чем комплект для производства фары. Что они готовы нам поставить готовый контроллер дешевле, чем компоненты для этого контроллера. И так дальше. И мы либо потеряем свое производство, либо мы попадаем в жесточайшую себестоимость. Еще она усугубляется дороговизной оборотных денег. Но это же выводит на первый план.


11:49

оптимизацию и цифровизацию. Естественно, для нас сложной частью является внутренняя логистика, потому что мы часто упираемся в оптимизацию производственных операций, какие-то дорогущие станки, сложные технологии, а у нас пролеживаемость, либо когда что-то не привезли вовремя, либо привезли не туда, становится ключевыми потерями, в первую очередь потерями времени.


12:18

Как нам учил Карл Маркс, любая экономия в конце концов сводится к экономии времени. Более либеральные ребята могут ссылаться на Роджана Махмудовича Сури в QRM. Для кого это базовая вещь, что надо экономить время, а остальное само подтянется. В том числе большой поклонник QRM Морозов. Я видел его наработки и прошу их сделать публичными.


12:44

именно схему, как анализировать потери, исходя из того, что все, что у нас есть на предприятии, это время наших людей, помноженное на их квалификацию, и время наших станков или рабочих центров, помноженное на их производительность. Это все наши ресурсы, все остальные ресурсы, включая деньги, они производные от этих двух ресурсов. Время людей и время рабочих центров.


13:12

Очень важная цифровая история про то, как передать часть работы на сторону заказчика. Иногда это просто необходимо, когда мы делаем какие-то сложные вещи для заказчиков, когда в процессе создания продукта идет постоянное вот это вот взаимодействие. И это становится важной историей. Иногда это просто вопрос экономии, так как люди привыкли сами покупать. Это важная часть.


13:43

и налаживание взаимодействия с заказчиком. А иногда это вопрос себестоимости, что если мы оплачиваем работу менеджеров, которые формируют заказы, как билеты в железной дороге либо покупка путевок, то мы проигрываем конкуренции тем компаниям, которые переложили это на клиента. Особенно, когда ему надо время посмотреть, подумать. И вот здесь вопрос личного кабинета и того же самого конфигуратора.


14:11

Очень важный вопрос, который раньше был за рамками производственной системы, который был внешний и я помню, еще даже 10 лет не прошло. Как мне говорят, слушай, вот это не важно, мы планируем токарную смену, значит нам кадровики пришлют токарей. Сейчас мы можем в любой момент взять лизинг 20 станков, а где мы возьмем 60 фрезеровщиков, а еще сложнее 5 технологов, а еще того человека, который может этим управлять.


14:41

И управление компетенциями стало, может быть, ключевой частью цифровой системы предприятия. Сейчас есть даже планировщики, которые выводят это в основной ресурс управления. То есть, когда мы имеем избыточные мощности, но недостаток квалифицированных кадров. Или когда у нас идет достаточно развитый рынок, и мы можем управлять аутсорсом,


15:10

факторов, свидетельствует за то, делать самим либо отдать что-то, или когда мы вынуждены что-то размещать, потому что у нас сложная гальванику, кто-то раскрой, кто-то длительные технологические процессы, как уже большинство строителей предпочитают покупать обработанную древесину.


15:40

Как когда-то это бросалось в глаза еще там 15 лет назад, что в Германии приходят подписанные упакованные пачки досок, вот это строить яхту, вот это строить забор настройки, вот это строить туалет настройки, а вот это класть полы, а вот это там обшить изнутри сауну. Теперь то же самое у нас формируется рынок, когда предприятие получает уже готовый прокат, иногда обрезанный.


16:08

когда на стороне кабельных компаний уже не производство только провода, а производство готовых кабелей, и когда идёт взаимодействие, концентрация, специализация на каких-то технологий, то есть гальваники или механообработки или ещё чего-то, и управление этим возлагает ещё большую нагрузку и выдвигает совершенно новые требования к цифре. И в первую очередь это информация.


16:38

что же надо сделать, когда это будет готово, кто кому что наобещал, выполняется ли то, о чем мы договорились, что делать, если это не выполняется, правильно ли мы отреагировали, какую мы сформировали новую картину мира при каких-то отклонениях, и все это данная информация. И у нас очень важная часть.


16:59

Это, в первую очередь, взаимодействие с технологическим контуром. У нас больше нет вот этих длинных технологических циклов, когда мы можем провести нюок, исследовать, потом согласовать план, построить под это громадный завод, выяснить потребности там, госплан это все расскажет, построят завод, построят жилье, детские садики, научат пришлют рабочих там, как на БАМ и так дальше. И, в конце концов, сейчас мы вынуждены балансировать этим сразу.


17:27

То есть когда пришел заказчик, он еще сам толком не понимает, что он хочет. Он требует, чтобы начали заказ, а он потом определится. И мы должны в реальном времени практически сформировать конструкторские, технологические отклонения и понимать свои мощности, маневрировать и составом изделия, и техпроцессом, и своим производством, и аутсорсом, и партнерами, и глубиной цепочки поставок.


17:56

что мы уже рассматривали на клубе примеры, когда у поставщиков идет на три уровня. Когда-то мне настаивали на том, что MES — это система цехового уровня, и надо управлять производством, оптимизировать производство. Сейчас самый важный вопрос — как ты управляешь цепочками? И несмотря на всю уязвимость и так дальше, уже есть компании, которые обеспечивают себе несколько уровней вложенности. Когда…


18:24

информационная система интегрирована настолько, что поставщики видят текущую потребность и иногда даже пополняют запасы без прямой команды по указанию информационной системы. Очень важная вещь. Я думаю, мы когда-то рассмотрим отдельно. Управление перемещениями, я уже говорил, что это важная вещь. Когда-то мы считали запасы злом, но буферизация это важный вопрос, в том числе и то, что держать оборотку в запасах


18:53

учитывая сезонные колебания, курсы, сложности с таможней и так дальше, это стало важным условием. То есть, если была политика, навязана нам бережливым производством, что запасы это зло, их надо уничтожать, теперь мы понимаем, что управление запасами и буферизация – это суперважный вопрос. И здесь, естественно, мы должны иметь информацию в реальном времени. Поэтому, прежде чем мы перейдем к планированию производства, нам нужно…


19:23

иметь инженерные данные, и данные с производства, и данные о наших заказчиках, и данные о наших заказах, и все это остальное. И в том числе мы должны как можно быстрее доносить до производства какие-то изменения, и естественно иметь, что происходит. Потому что вот эта скорость реакции управляющей системы


19:51

Вот та самая заморозка, она является, нехорошее молдаванское слово, это самая важная часть управления, потому что выигрывая в скорости, ты можешь избавить себя от необходимости много чего делать, ты можешь много на чем сэкономить, в том числе...


20:15

понимая, что если у тебя план какой-то значительный, да, на новонастей, то производственная картина изменилась за это время. И в том числе производство будет смотреть, как там у Майковского, на русский выпячивают глаза, глядят, как на ворота коза и так дальше, когда у производства ситуация изменилась, а им из картины вчерашнего дня спускают новый план. И в том числе качество самого этого плана резко падает.


20:43

И в том числе очень интересный процесс, когда рынок сильно меняется и рынок сильно изменяется, что попытка реагировать на все мелочи приводит к потере управляемости и к неконтролируемым издержкам. Что когда у тебя нет достоверной информации, то самое правильное – это сидеть и лишний раз не дергаться. Как мастер единоборств не реагирует на те удары, которые не являются для него.


21:13

катастрофическими, и тем более на те, которые не достигают цели. Ну и вопрос о цифровке дополнительных контуров, потому что это распространенная ошибка, и это очень значимый фактор потери ресурсов, в том числе экспертизы и времени руководства. Когда мы пытаемся выкручивать основной процесс, не понимая, что у нас все проблемы идут в вспомогательных процессах,


21:42

а еще больше возвратные процессы, что нам ред уж стоит больше, чем мы заработали с основного производства, и много чего еще. Но сейчас уже пора экономить время. Я сейчас у Александра Викторовича займу 10 минут, он мне обещал, потому что это очень важные вещи, я хочу, чтобы они остались на записи. Что же нам требуется при обработке данных? Во-первых, нормализация данных.


22:12

То есть отделить какие-то отклонения, то есть превратить данные к единому формату измерения. Потому что даже когда ты делаешь презентацию, вот эта вот вещь, что ты все ставишь в миллиметрах, а Powerpoint работает в дюймах, и то мешает. А на производстве нормализация данных — это вопрос вопросов, когда вы измеряете все в одинаковых единицах. И даже...


22:38

Если взять обычную заправку, то там перевод кубов в литры и в килограммы — это целая отдельная история. Потом вопрос параметризации этих данных — отдельная задача. То есть какие данные, какие измеримые параметры нам важны, какие не важны? Какие являются основными, какими производными? Какие мы будем обсчитывать, какие мы будем игнорировать?


23:06

И вопрос с управлением и обработкой этих данных. Для краткости я написал статистика, но это все. Начиная от культуры смотреть в реал тайме на дашборды, которые в реал тайме, это отдельная история про дата-дривинг компании и цифровую культуру на производстве, и до искусственного интеллекта. То есть как мы обрабатываем эти данные, как мы умеем использовать инструменты для этого данного.


23:34

Ну и то, что у нас есть текущие задачи, есть задачи понимания, что происходило в прошлом. А кроме тех данных, которые мы сохранили, у нас уже очень тяжело что-то о прошлом. Прошлое очень быстро уходит в туман истории. И то, чего никому не удается, но все очень хотят, это попытка предвидеть будущее, предсказать будущее, повлиять на будущее. И вот здесь нас стоит вопрос.


24:02

что нам не нужны сырые данные, что нам нужны данные агрегированные, что когда-то нам нужно правильно понимать данные за период. То есть не что произошло в конкретный момент, вот какое-то событие зажглась красной лампочкой, а нас свидетельствует о том, что у нас температура печки 101 градус. А о том, что происходило за какой-то период, как происходила термограмма этой термички, или сколько мы запилили за неделю или за квартал, или за месяц, за который мы должны заплатить.


24:31

зарплату сотруднику и так дальше. Это собрать все разные данные для какой-то роли, потому что технолог уже не может только оперировать технологиями и делать совершенную технологию, не обращая внимания, что производство само справится, а конструктор знает, что он там нарисовал. То есть мы должны из разных источников собрать полную картину для любой производственной либо вспомогательной роли. И это непростая история.


24:59

Потому что даже то, что когда мы планируем производство, мы должны знать, а кто выйдет на работу, кто не выйдет, кому положен отпуск, какие у нас будут доступны нам ресурсы. То есть когда производству нужны данные ото всюду, технологу нужны данные ото всюду, когда любой роли могут понадобиться в той или иной форме, данные ото всюду.


25:21

И тут становится вопрос о том, что иногда у нас субъектом является подразделение, когда мы должны агрегировать данные по подразделению не для какого-то сотрудника, который что-то управляет или что-то исполняет, а объединить данные по подразделению. Второй вопрос. Данные очень зависят от контекста. Старый очень анекдот, но для производства он самый актуальный. Штурман, прибор. 80. Что 80? А что прибор?


25:49

И вот это очень часто характеризует именно то, как мы используем данные. То есть мы чего-то намерили, поэтому данные ситуационно зависимы. В разной ситуации один и тот же показатель свидетельствует о совершенно разных ситуациях и совершенно разных трендах. Опять же, данные очень сильно зависят от роли. То есть к кому мы показываем эти данные? Потому что может быть...


26:18

Данные, которые нужны мастеру, который прямо сейчас управляет сменой на участке, они супер важны. Это его зона ответственности. А генеральному директору они не важны, иначе он утонет в операционке. А бывает наоборот, когда мы должны донести стратегическое видение, спустить его вниз, и людям будет легче, потому что они люди, они хотят работать осознанно. И когда они руководствуются тактикой,


26:46

или рулят тактикой, будут руководствовать со стратегией, это хорошо. И вот здесь встает очень важный вопрос для информационных систем, это маскировка данных. То есть когда у нас мы должны подавить избыточные данные, потому что когда-то вот этот информационный голос, и я помню вот эти громадные пульты в стиле космической станции, или там сейчас даже кабины вертолета или истребителя.


27:17

Сейчас сокращается экипаж в половину на новых атомных лайнерах, сокращается экипаж круизных лайнеров. И это приводит к тому, что у нас потребность подавить лишние данные, она очень важна. То есть что мы спрячем сейчас в зависимости того от ситуации, что, собственно, происходит, и в зависимости от того, кому мы показываем эти данные, что лишние данные надо подавить, потому что у людей есть когнитивный порог.


27:45

Когнитивный порог невысокий. И уже давно все замеряно, что больше там шести мониторов человек не может уследить за ними. Он что-то важное упустит. И поэтому взять и достать всю нефтяную компанию на один пульт управления, просто мы перегружаем операторов. И у них происходит либо выгорание, как тому авиадиспетчеров и так дальше, то есть супе либо они теряют часть значимой информации. У нас есть...


28:12

В том числе и перспективный, но сложный и опасный путь – это часть обработки данных переложить на систему, в том числе и часть принятия решений. И вот здесь вопрос, насколько мы правильно сортируем эти данные, насколько мы правильно определяем приоритеты. Потому что слово рейтинг я взял, чтобы маленький квадратик был на большом слайде. А приоритеты – это очень важно.


28:41

то есть начиная от цветовой дифференциации штанов, что мы привыкли, что желтое — это внимание, а красное — это авария, а зеленое — значит, все хорошо. И заканчивая тем, что более какими-то сложными алгоритмами, что когда мы должны отделить важно от неважного, зависимость от ситуации и от роли, от того, что происходит. Очень важный момент, который сейчас мы не будем подробно обсуждать.


29:09

Но это важно, это вопрос использования в этом деле искусственного интеллекта. Что мы не описали толком процессы, мы не сделали толком модели. Хотя это делается, делаются уже в библиотеке. Уже вот эти разговоры потихонечку отходят, что у нас уникальные процессы. И начали предприятия понимать, что не бывает уникальных процессов. Что счастливые и счастливые одинаково, несчастливые и несчастливые каждый по-своему.


29:39

Вопрос, что процессы в зависимости физика одинаковые на всех предприятиях, но набор у каждого разный, ситуация у каждого разная, набор компетенций у каждого разный, паттерны реагирования разные и так дальше. Как человек лично является набором его разочарований, так и у предприятия на типовые совершенно стандартные бизнес-процессы, но что ты там скомандуешь электричество? Есть электричество.


30:08

или, допустим, одинаковые мета станки, то практика их использования совершенно разная. Вопрос о том, что нам надо правильно обрабатывать исторические данные, совершенно по-другому мы должны обрабатывать оперативные данные, потому что нам нужна скорость, здесь выходит на первый план, и отделение важного от неважного, в реалтайме мы не можем обрабатывать всё.


30:33

Если регрессные данные мы можем включить ночью и там нейронку, либо дать ее на аутсорс, где электричество дешевое, и там обрабатывать какие-то модели, то в оперативной мы не можем сделать такие системы алгоритма, которые будут реагировать моментально и при этом обрабатывать все. И другой подход. Совершенно другой подход в предиктивном анализе. В том числе мы должны разделять две вещи, чтобы мы пытаемся предсказать какие-то события.


31:02

какой-то долей вероятности, естественно, в силу того, что искусственный интеллект у нас еще детский, и в силу того, что будущее невозможно предсказать. Или мы хотим вычислить тренды, и это разный подход, разные инструментарии, это разные информационные системы, разные навыки и разная культура применения в зависимости от двух состояний. Мы пытаемся предсказать тренды, либо мы пытаемся предсказать...


31:28

ситуации, то есть что произойдет и с какой вероятностью у нас крякнет именно этот подшипник. Или вопрос, куда все катится. Совершенно другая история. Тут же вопрос, мы возвращаемся к нормализации данных и так как это очень важная задача, но с ней все плохо, есть примеры того, когда достаточно успешно пытаются поручить это тоже искусственному интеллекту, что если мы не можем победить задвоение, ну это не Одинесков, который нет задвоения в справочниках,


31:55

Поэтому давайте, пускай нам искусственный интеллект ищет задвоение. Есть и перспективные, и печальные истории. Это очистка данных, потому что бывают и ошибки в сборе данных, и ошибки человеческие, и так дальше. И в том числе вероятностные модели здесь уже и принесли нам и проблем, но и очень серьезные успехи. Это вопрос пластеризации всего, то есть и систем.


32:22

потому что мы не можем построить какую-то мега-систему, мега-интеллект, которая будет управлять сразу всем заводом, предприятием, страной, цивилизацией и так дальше. То есть это вопрос правильного разделения, то есть где мы будем использовать более широкий подход, где более узкий подход. Это вопрос выявить, какие факторы, то есть что же влияет, не просто понять ситуацию, а что на это влияет. И естественно, вот этот векторный баланс каких-то сил


32:52

он нам расскажет что, куда и почему. Это вопрос о том, что освоили достаточно быстро. И пускай искусственный интеллект дает грязные данные, но я думаю, большинство здесь уже привыкли, что нейронка тебе очень быстренько, быстрее, чем ты напечатаешь, что если напиши 120 пунктов протота, и ты понимаешь, что 20 из них это иллюзии сети, еще 20 повторяются, но производительность в поиске данных...


33:20

она очень высока. И одновременно мы прикалывались с учениками, когда Алиса нас обманывает, врет и выкручивается почти как трехлетний ребенок. И с другой стороны, мы видим примеры, насколько это эффективнее в поиске данных, когда ты в том же Яндексе видишь нейропоиск, и он дает ответ на твой вопрос. Тебе не надо промотать рекламные ссылки, потом...


33:46

искать значимые ссылки, потом смотреть не упустил ли что-то важное, то есть делать какое-то наложение разных там статей, которые друг у друга перерирайте или заполняй ключевиками, а что очень часто уже нейро дает тебе ответ на твой вопрос. Ну, с определенными это. Очень важный вопрос и тут свой инструментарий и надо его рассматривать отдельно. Самая важная часть это той, которой мы не видим.


34:16

Как для человека важна его тень, еще нам Карл Густавич Юнг завещал. Как и на предприятии, очень часто важнее те данные, которых мы не видим, а не важнее, чем того, что мы видим. Вот эта серая либо черная зона, в ней происходят более важные явления, которые приведут к тому, что как только мы все поняли, тут же все рухнуло. То есть картина мира изменилась. И это очень важный вопрос, и здесь вот тот же самый искусственный интеллект может помочь.


34:47

А где-то, наоборот, нам нужно вернуться к классике и применить сначала стат-контроль, нефуры и так дальше. Вопрос, какими данными мы пожертвуем и какими факторами мы пожертвуем, это очень важный вопрос. Иногда нам надо принимать это решение очень быстро, что мы не можем анализировать всё, поэтому чем мы пожертвуем, а что мы сочтём важным из этих факторов. Очень важный вопрос до обучения, то есть когда мы...


35:16

не можем ждать совершенной модели, мы что-то сделали, а в какой-то момент мы должны решить. Мы будем допиливать эту экспертную систему, мы заменим на более совершенную. И даже переесть с новой версии на новую версию фреймворка – это целая история. Сейчас даже простейший пример. По многим вопросам видно, насколько там чад GPT-4, самая последняя версия, насколько она дает лучшую выдачу, чем там 3 или 3,5.


35:45

Но 3,5 мне доступно бесплатно по одному клику. А 4 — это целая история. Надо прикинуться не русским, надо организовать канал, надо организовать платную подписку, надо организовать хранение истории, надо избежать при этом конфликтов, потому что как-то ты доказал, что не русский, Яндекс говорит, а я с тобой не буду работать. Как только ты говоришь, да я русский, вот смотрите, тут же тебе иностранные сервисы говорят, что слушай, а...


36:12

мы с тобой не будем разговаривать. Это целая отдельная история. И в том числе до обучения, сейчас говорю о до обучении модели, что в какой-то момент мы должны принять решение. Мы допиливаем старую модель, и как мы это будем делать, как будет переезд. Либо остаемся на старой версии, допиливаем, либо как мы переедем на новую версию. И это отдельная история про вот это вот партирование, про вот этот вот переезд любой информационной системы, не только искусство интеллекта, а новой версии планировщика.


36:42

новой версии любой системы, потому что я сам переехал с 16 версии на 18 вводу в личных ресурсах, и там встряли в болото. Как работают новые фичи никто не понимает, все занимаются 17, ну и в общем прикладные задачи все встали, хотя есть куча программистов и куча специалистов. Но есть еще не менее важные вопросы по искусственному интеллекту, то есть как...


37:11

новые данные встраивать к уже обработанным. И вопрос, насколько мы можем доверять экспертным системам в консолидации данных, то есть доверять им делать выводы из этих данных. Как мы, насколько мы можем понимать, насколько правильная интеграция, насколько не упущено всего важного, насколько учтены все тренды и так дальше. То есть насколько мы можем консолидацию данных доверять искусству и интеллекту.


37:38

Сейчас может быть много непонятных слов, особенно то, что для компактности я даже разместил разные слова, но любая из этих клеточек, это отдельная история не только одной конференции, а тут по каждой клеточке три НИИ могут свою карьеру похоронить. Ну и чтобы закончить эту тему, что нас все-таки ждут гибридные модели. Все уже понимают, что искусственный интеллект не является панацеей.


38:08

о том, что в каких-то случаях ситуация неуправляемая, о том, что критически важную инфраструктуру ему доверять нельзя, особенно вероятностным моделям, что у нас самолет должен долететь с вероятностью 100% и о том, что нам бы хотелось, чтобы горячая вода тоже была всегда, а не с какой-то вероятностью. И вот тут вопрос, который сегодня...


38:37

тоже, я надеюсь, докладчики затронут и которые может быть самые важные. Что у нас работа с данными в зависимости от ситуации, подходы разные. Какие задачи мы ставим? То есть то ли мы оптимизируем свою систему, нам нужен фитн система, что мы хотим быть не первыми на выход на этом рынке, который очень сильно меняется. И мы просто оптимизируем свою систему, пытаясь сделать ее.


39:07

То есть там стройный, пытаясь сделать ее более гибкой, изменяться в зависимости от ситуации, заставляя ее работать несколько быстрее. То ли мы пытаемся перестроить, то есть создать какую-то новую модель производства, и мы задумали какую-то трансформацию, нас было-стало отличается. Что чем мы будем кормить людей по пути? То есть из Египта мы ушли, помним исход, а еще куда-то мы не пришли, мы оказались в пустыне.


39:34

И вот эта вот ситуация, это совершенно другой подход ко всему. Это совершенно отдельная история. Она требует другого подхода, других моделей, другой экспертизы. Ключевые моменты здесь. Это то, что правильно провести ревизию, что есть. С одной стороны, это тратится время, с другой стороны, это важная история, исследования, конфликт интересов. Чем лучше мы проанализируем то, что сейчас, тем больше мы потеряем времени. Но тем точнее будут наши, тем оптимальнее сработают наши ресурсы в любой ситуация. То есть...


40:02

Оптимизируем ли мы производственную систему, трансформируем ее, либо мы внедряем какой-то продукт. Хотя я надеюсь, что третий пункт когда-то исчезнет. Вопрос, насколько мы проанализировали источники своих данных, за сколько им доверять, как им описывать, что они могут, что мы от них получаем лишнего, где они нам врут, что еще мы можем получить из тех же источников, какие из них завтра отвалятся, какие нуждаются в уточнении, в коррекции, в реконструкции, в контроле и так дальше. Кто у нас владелец данных?


40:33

потому что все вокруг колхозное, все вокруг мое, мы понимаем, что у семи нянек дитя без ока. И владельцы данных – это может быть одна из первичных историй, то есть кто у нас отвечает за чьи данные. Обе истории очень печальны, когда у нас что-то принадлежит никому, и создается вот эта точка гниения, которая погубила в том числе громадные тракторные заводы. Это просто то, в чем я участвовал, я думаю, что катастрофа гораздо больше.


41:00

И с другой стороны, когда у нас начинается феодальная конкуренция, когда у нас одни и те же данные, им командует несколько субъектов. Где у нас в этих информационных потоках те дырки, потому что это не только источник боли, а в том числе источник роста. То есть как только ты какой-то разрыв в потоке информации перекрыл, как бляшки там, сосудок, все, все сразу стало полегчало во многих даже неожиданных местах.


41:29

лишнюю информацию, которая не нужна. То есть сейчас, я уже говорил, скорее избыток информации. Как мы опишем процессы, потому что данные – это живое предприятие, нам не нужны данные как какие-то цифры, нам не нужны данные как срез какой-то. Мы понимаем, что нам нужны данные, как отражающий какой-то поток взаимодействия.


41:49

Потом вопрос, как мы оцифровываем технологии, насколько мы их контролируем. Это тоже вопрос, то есть описать на старте свои технологии, в том числе, какие нам нужны, какие нужнаются в изменении, какие-то являются нашим ключом, какие нам надо усилить, какие-то нам нужно возможно использовать более простые технологии где-то. И тут вопрос, а какие метрики мы, то есть как мы будем измерять, в том числе, как мы будем измерять работу с данными.


42:14

И в том числе это метрики, относящиеся к данным, к производственной системе, к цифровой, и метрики, которые мы накладываем на людей. То есть KPI для краткости, не обязательно они влияют на зарплату, как привычно, KPI — это то, что влияет на твой премий. Нет, это то, что характеризует, а насколько хорошо ты работаешь, насколько это соответствует твоим задачам, насколько ты справился с ситуацией и делаешь ли то, зачем тебя позвали на работу. И, естественно, точно также целевое состояние.


42:43

И тут вопрос о том, что не бывает точных целей. Что у нас видение будущего – это так себе картина, которая только отражает какие-то наши сегодняшние иллюзии. И поэтому мы понимаем, что мы будем делать итеративную модель. Да, agile – это отрасли, да, мы очень много капнули горя на том, что жесткими моделями пожертвовали в пользу нестабильных итеративных, но итеративная модель – это не обязательно про agile.


43:11

И, жаль, когда у тебя нет цели, но ты ищешь путь. А итеративные модели — это нечто про другого. Вопрос, что риски есть всегда в любом проекте — это обязательная часть. Я вчера говорил, что очень компетентным человеком попал на вебинар. И риски, если человек не понимает, что риски — все, это не зачет по проектному менеджеру. Любой проект, ты должен смирать цель, цель должна быть измеримой, ты должен понимать, что у тебя ресурсы, что у тебя есть риски. Это вот такая базовая база. Это проект, это не pre-payment book.


43:41

Второй вопрос, что мы должны учитывать субъектность, еще один вопрос. Субъектность в том, что когда мы что-то задумали, а как на это отреагируют наши сотрудники, как на это отреагируют конкуренты, как на это отреагируют наши партнеры, как на это отреагируют сообщества вообще и наши потребители в частности. Очень сильное влияние правительства, что пока мы делаем какую-то трансформацию, власти принимают новые законы, и учитываем ли мы это в своей картине в виде небудучего.


44:09

какие у нас есть компетенции, что делают наши сотрудники, кто-то будет клопать в ладоши, наконец-то у меня все на смартфоне, а кто-то возьмет и уволится, потому что его работа стала прозрачной, и он к этому не готов, или ему изменения даются болезненно. Потому что пока мы действуем сами, на рынках тоже происходят изменения, действует и наши партнеры меняются, и наши конкуренты меняются. Насколько мы согласуем действие с нашими партнерами, это наше решение. Иногда надо действовать в одиночку и не ждать всех остальных.


44:37

Ребята, вы можете продолжать сидеть, а я пошел, потому что наш айсберг тает. Старая книжка, но все актуальнее становится. А вот вопрос иногда наоборот. Нужно собирать коалицию, артель, может быть неформальное объединение, действовать сообща. Но и что трансформация не очень важная история, тут тоже вопрос цели, вопрос стратегии, вопрос о том, что культура есть стратегию на завтрак и насколько мы...


45:05

будем прививать новые правила, насколько они приживутся. Это важнейший вопрос о том, что нам придется учить людей при этом. То есть переучивать. Если мы рассчитываем на новую ситуацию, то нам нужны и новые навыки. О том, надо ли нам вести магистральную вещь или какие-то параллельные. Это вопрос вопросов. То есть какие вещи можно распараллелировать, какие-то нельзя, какие должны быть вперед сделаны, какие попозже. Это все очень важная история.


45:34

и в том числе какие установить ключевые точки, как мы это будем все измерять и оценивать, и что нам нужно сейчас, какие критерии мы ведем потом. Ну и внедрение – это отдельная история. И пока мы не решим вот эти вот все вопросы, потому что сроки внедрения стали категорически важны, что уже вот эти двухлетние внедрения, ну, смешно об этом говорить. Это хорошая история, что идет кластеризация всего, что уже нет вот этих мегамонстров.


46:04

Но с другой стороны, все эти микросервисы и локальная автоматизация приводят к другим вопросам, что у тебя появляются некие неуправляемые зоопарки, твоя система превращается в некого франкенштейна. Но правильный подход, скорее кластеризация, это возможность вот что-то делать по чуть-чуть. Вот в Манке и здесь.


46:26

Самый, может быть, важный вопрос — это создать вот эту цепочку. Называем мы это проектным конвейером или как-то другого, что мы понимаем, что у нас нет мероприятия, что цифровизация — это процесс. И он непрерывный. То есть делали, получили, отрефлексировали. Но кому классно, кому это больше заходит, рисуйте от CyclePGCA. Ну и вопрос, что когда начинаешь в это копать, вопросов становится больше, чем ответов.


46:54

На этом я хотел бы финализировать. Я надеюсь, что самый важный вопрос еще, что ресурсы всегда ограничены. Мы не можем сделать... Как это? Говорила тетя Соня из Одессы, «Люди, я на вас удивляюсь. Выходите все сразу, все сразу бесплатно. Так ждите». То есть о том, что мы ограничены, наши цели ограничены нашим ресурсным пространством. Это, пожалуй, то, на чем я хотел сейчас завершить.


47:21

И я прошу прощения, очень много времени я украл у Александра Викторовича. Думаю, он выкрутится из ситуации и отнесется к этому по-жентльменски. Прошу приступить к докладу. Извиняюсь за задержку. Настолько это болезненная тема, я бы важность этой темы тоже подчеркнуть.



#UDM25_0 01 ЧИСТЫЕ И ГРЯЗНЫЕ ДАННЫЕ, Вступление - Игорь Третьяков
IT_InBIT 24 января 2025 г.
Share this post
Теги
Архивировать
#UDM24_8 17 Борис Морозов, КамАЗ -- ИТОГИ ГОДА 2024 и тренды цифровизации на 2025