Фотоловушка — фотоаппарат, спроектированный для долгой автономной работы (т. е. съёмки без участия человека). Имеет специальный датчик, реагирующий на движение (движение животного, полёт птицы, колыхание травы), благодаря которому делается снимок.
Автоматизация — использование технологий для того, чтобы процессы и задачи, обычно выполняемые человеком, выполнялись без его участия. Сегодня автоматизация чаще всего связана с применением компьютера и специальных программ.
Нейросеть — математическая модель и основанная на ней программа, обрабатывающие данные способом, максимально приближенным к тому, как это делает человеческий мозг.
Облачные технологии (Облако) — это услуга, с помощью которой пользователь по сети получает доступ к вычислительным ресурсам (процессоры, оперативная память, дисковое пространство, сетевые соединения), сервисам или программам и может пользоваться ими для решения своих IT-задач.
Персональный компьютер — стационарное или переносное (ноутбук, планшет) вычислительное устройство, предназначенное для индивидуального использования.
Вычислительные мощности — производительность устройства, оценка его способности выполнять вычисления и обрабатывать данные за определённый период времени.
Вычислительные ресурсы — аппаратные и программные компоненты компьютера, которые используются для выполнения вычислений и обработки данных.
Дата-центр — здание или комплекс зданий, предназначенные для размещения специальных компьютеров и другого оборудования для хранения, обработки и распространения данных.
Большие данные (Big Data) — разнообразные массивы информации, которые слишком велики или сложны для обработки обычными способами. Для их анализа используют специальные технологии и программы.
Облачные сервисы — заранее настроенное в Облаке и готовое к использованию программное обеспечение, которое позволяет пользователю решать конкретные IT-задачи.
Графический процессор (GPU) — специализированная электронная схема, которая оптимизирована для быстрой обработки большого объёма данных, необходимых для графических приложений.
Компьютерное зрение — набор методов, позволяющих компьютеру извлекать информацию из изображения: определять объект и его местоположение.
Пиксель — термин, получившийся из первых слогов двух английских слов picture и element и означающий «элемент изображения». Характеризуется координатами и значениями яркости и цвета.
Свёртка — математическая операция, которая используется в нейросетях для выделения признаков объектов.
Object Detection — нейросеть для поиска и определения объектов на фото.
Фильтр свёртки — небольшая квадратная матрица, которая выделяет квадрат такого же размера из всего массива пикселей изображения и «скользит» по изображению. При этом на каждом шаге выполняются математические операции, такие как умножение и суммирование значений пикселей и элементов фильтра, что позволяет выделять важные признаки объекта.
Матрица — прямоугольная числовая таблица, в ячейках которой находятся числа.
Вес фильтра — значение каждого элемента фильтра, которое определяет степень влияния этого элемента на результат операции свёртки.
Object Classification — нейросеть для классификации объектов на изображении.
Обучение нейросети — процесс, в ходе которого модель (нейросеть) обучается распознавать паттерны и делать предсказания на основе данных.
Датасет — набор данных, которые собраны и организованы для конкретной задачи или исследования. Датасеты используются в различных видах анализа и машинного обучения.
Фрикулинг — способ охлаждения компьютеров и серверов в дата-центрах за счёт использования воздуха с улицы.
Отказоустойчивость — свойство машины сохранять работоспособность, даже если есть неисправность.
Масштабирование — процесс увеличения количества серверов, при котором разработчики могут подключать новые устройства без ограничений для обработки большого количества данных.
Серверная стойка — металлическая конструкция, которая используется для хранения серверов. Она обеспечивает удобную организацию техники и создаёт необходимые условия для работы компьютеров.
Терабайт — единица измерения количества информации. 1 терабайт (ТБ) — это 1 024 гигабайта (ГБ). Столько весят примерно 2 000 полнометражных фильмов или 250 000 песен.
Запрос на сервер — сообщение, которое отправляется на сервер для выполнения на нём каких‑либо действий.
Машинное обучение — направление искусственного интеллекта, в котором компьютерные системы обучаются на данных и совершенствуются с помощью опыта.
Исторические данные — информация, которую используют разработчики для анализа прошедшей работы серверов и программ. Включают в себя данные о нагрузке на серверы, причинах поломок и неисправностей, возможных уязвимых точках системы.
Автоматизация — использование технологий для того, чтобы процессы и задачи, обычно выполняемые человеком, выполнялись без его участия. Сегодня автоматизация чаще всего связана с применением компьютера и специальных программ.
Большие данные (Big data) — разнообразные массивы информации, которые слишком велики или сложны для обработки обычными способами. Для их анализа используют специальные технологии и программы.
Вес фильтра — значение каждого элемента фильтра, которое определяет степень влияния этого элемента на результат операции свёртки.
Вычислительные мощности — производительность устройства, оценка его способности выполнять вычисления и обрабатывать данные за определённый период времени.
Вычислительные ресурсы — аппаратные и программные компоненты компьютера, которые используются для выполнения вычислений и обработки данных.
Графический процессор (GPU) — специализированная электронная схема, которая оптимизирована для быстрой обработки большого объёма данных, необходимых для графических приложений.
Датасет — набор данных, которые собраны и организованы для конкретной задачи или исследования. Датасеты используются в различных видах анализа и машинного обучения.
Дата-центр — здание или комплекс зданий, предназначенные для размещения специальных компьютеров и другого оборудования для хранения, обработки и распространения данных.
Дообучение нейросети — процесс, когда нейросеть учится на новых данных, чтобы лучше выполнять освоенные задачи.
Запрос на сервер — сообщение, которое отправляется на сервер для выполнения на нём каких‑либо действий.
Исторические данные — информация, которую используют разработчики для анализа прошедшей работы серверов и программ. Включают в себя данные о нагрузке на серверы, причинах поломок и неисправностей, возможных уязвимых точках системы.
Компьютерное зрение — набор методов, позволяющих компьютеру извлекать информацию из изображения: определять объект и его местоположение.
Матрица — прямоугольная числовая таблица, в ячейках которой находятся числа.
Масштабирование — процесс увеличения количества серверов, при котором разработчики могут подключать новые устройства без ограничений для обработки большого количества данных.
Машинное обучение — направление искусственного интеллекта, в котором компьютерные системы обучаются на данных и совершенствуются с помощью опыта.
Нейросеть — математическая модель и основанная на ней программа, обрабатывающие данные способом, максимально приближённым к тому, как это делает человеческий мозг.
Object Classification — нейросеть для классификации объектов на изображении.
Object Detection — нейросеть для поиска и определения объектов на фото.
Облачные сервисы — заранее настроенное в Облаке и готовое к использованию программное обеспечение, которое позволяет пользователю решать конкретные IT-задачи.
Облачные технологии (Облако) — это услуга, с помощью которой пользователь по Сети получает доступ к вычислительным ресурсам (процессоры, оперативная память, дисковое пространство, сетевые соединения), сервисам или программам и может пользоваться ими для решения своих IT-задач.
Обучение нейросети — процесс, в ходе которого модель (нейросеть) обучается распознавать паттерны и делать предсказания на основе данных.
Отказоустойчивость — свойство машины сохранять работоспособность, даже если есть неисправность.
Персональный компьютер — стационарное или переносное (ноутбук, планшет) вычислительное устройство, предназначенное для индивидуального использования.
Пиксель — термин, получившийся из первых слогов двух английских слов picture и element, и означающий «элемент изображения». Характеризуется координатами и значениями яркости и цвета.
Программное обеспечение — набор инструкций, благодаря которым компьютер понимает, как работать.
Свёртка — математическая операция, которая используется в нейросетях для выделения признаков объектов.
Свёрточная нейросеть — класс нейронных сетей, специализирующихся на обработке изображений и видео за счёт осуществления операции свёртки.
Сервер — устройство, которое обладает высокой производительностью, хранит большое количество данных и по запросу может предоставлять доступ к ним другим устройствам.
Серверная стойка — металлическая конструкция, которая используется для хранения серверов. Она обеспечивает удобную организацию техники и создаёт необходимые условия для работы компьютеров.
Сетевое оборудование — физические устройства, которые используются для подключения компьютеров друг к другу и к Сети, позволяя им обмениваться информацией и ресурсами.
Терабайт — единица измерения количества информации. 1 терабайт (ТБ) — это 1 024 гигабайта (ГБ). Столько весят примерно 2 000 полнометражных фильмов или 250 000 песен.
Фильтр свёртки — небольшая квадратная матрица, которая выделяет квадрат такого же размера из всего массива пикселей изображения и «скользит» по изображению. При этом на каждом шаге выполняются математические операции, такие как умножение и суммирование значений пикселей и элементов фильтра, что позволяет выделять важные признаки объекта.
Фотоловушка — фотоаппарат, спроектированный для долгой автономной работы (т. е. съёмки без участия человека). Имеет специальный датчик, реагирующий на движение (движение животного, полёт птицы, колыхание травы), благодаря которому делается снимок.
Фрикулинг — способ охлаждения компьютеров и серверов в дата-центрах за счёт использования воздуха с улицы.
Хранилище данных — система хранения и управления большими объёмами структурированных и неструктурированных данных.
Смотрите: по этому узору и можно распознать Лапку. У него на теле есть другие уникальные пятна, но самое яркое и очевидное расположено именно на лбу.
Именно на первом этапе мы и получили 500 фотографий снежных барсов. Но, чтобы найти Лапку и не просматривать всё вручную, сотрудники используют другое решение.
Она распределяет изображения барсов по классам, создавая отдельный для каждой особи и помещая в него фотографии конкретного барса. Таким образом, фотографии с Лапкой попадут в один класс, а фотографии с другими барсами — в другие.
Задание
Да! Как вы думаете, может ли нейросеть обучаться?
Правильно! Нейросеть тоже умеет учиться. Мы можем обучить её работать так, как нам нужно. Для этого нейросети необходим большой объём данных — он называется датасет.
Упс! На самом деле нейросеть умеет учиться не хуже, чем люди. Просто люди ей немножко помогают. Мы можем обучить её работать так, как нам нужно. Для этого нейросети необходимо предоставить большой объём данных — он называется датасет.
Чем больше фотографий мы используем для обучения нейросети, тем точнее она сможет распознавать разных особей и классифицировать их. Так что в неё можно загрузить и 40, и 100 и даже 500 тысяч фотографий барсов.
Подробнее об этом читайте в главе «Облачные технологии».
Задача нейросети — изучить датасет, выделить признаки объекта, сравнить с учебной базой фотографий и сделать вывод. А инженер даёт максимальное количество информации о том, как выглядит объект.
Задание
Помогите собрать разнообразный датасет из предложенных фотографий. Важно отобрать
фотографии барса с разных ракурсов и в разное время суток, чтобы обучить нейросеть его узнавать.
Вам нужно выбрать 6 фотографий. Кликайте на изображение, чтобы добавить его в датасет для нейросети.
Специалист по машинному обучению
Обучить программу находить барсов и различать среди них Лапку — задача из разряда обычных для специалиста по машинному обучению. Именно он создаёт программы и алгоритмы, которые позволяют нейросетям учиться и делать прогнозы на основе данных. Таким специалистам нужно хорошо знать математику и не бояться сложных задачек.
Для такой проверки нейросеть показывает фотографии, на которых определила искомый объект, а человек отвечает, права она или нет. Если нейросеть ошибается, это значит, что ей нужно ещё немного поучиться, — цикл повторяется. Мы дообучаем нейросеть до тех пор, пока она не научится верно определять Лапку на всех фотографиях. Программа снова анализирует фотографии, чтобы не ошибиться в следующий раз.
Так нейросеть дообучается с помощью человека и продолжает совершенствовать свои ответы уже без помощи инженера. Всё просто, готовы попробовать?
Задание
Нейросеть покажет вам несколько фотографий. Она предположила, что на них изображён Лапка. Ваша задача — отмечать, права ли нейросеть, а по ответам она будет дообучаться.
Спасибо! Теперь нейросеть умеет лучше классифицировать барсов! Давайте подведём итог и отправимся дальше.