Фотоловушка — фотоаппарат, спроектированный для долгой автономной работы (т. е. съёмки без участия человека). Имеет специальный датчик, реагирующий на движение (движение животного, полёт птицы, колыхание травы), благодаря которому делается снимок.
Автоматизация — использование технологий для того, чтобы процессы и задачи, обычно выполняемые человеком, выполнялись без его участия. Сегодня автоматизация чаще всего связана с применением компьютера и специальных программ.
Нейросеть — математическая модель и основанная на ней программа, обрабатывающие данные способом, максимально приближенным к тому, как это делает человеческий мозг.
Облачные технологии (Облако) — это услуга, с помощью которой пользователь по сети получает доступ к вычислительным ресурсам (процессоры, оперативная память, дисковое пространство, сетевые соединения), сервисам или программам и может пользоваться ими для решения своих IT-задач.
Персональный компьютер — стационарное или переносное (ноутбук, планшет) вычислительное устройство, предназначенное для индивидуального использования.
Вычислительные мощности — производительность устройства, оценка его способности выполнять вычисления и обрабатывать данные за определённый период времени.
Вычислительные ресурсы — аппаратные и программные компоненты компьютера, которые используются для выполнения вычислений и обработки данных.
Дата-центр — здание или комплекс зданий, предназначенные для размещения специальных компьютеров и другого оборудования для хранения, обработки и распространения данных.
Большие данные (Big Data) — разнообразные массивы информации, которые слишком велики или сложны для обработки обычными способами. Для их анализа используют специальные технологии и программы.
Облачные сервисы — заранее настроенное в Облаке и готовое к использованию программное обеспечение, которое позволяет пользователю решать конкретные IT-задачи.
Графический процессор (GPU) — специализированная электронная схема, которая оптимизирована для быстрой обработки большого объёма данных, необходимых для графических приложений.
Компьютерное зрение — набор методов, позволяющих компьютеру извлекать информацию из изображения: определять объект и его местоположение.
Пиксель — термин, получившийся из первых слогов двух английских слов picture и element и означающий «элемент изображения». Характеризуется координатами и значениями яркости и цвета.
Свёртка — математическая операция, которая используется в нейросетях для выделения признаков объектов.
Object Detection — нейросеть для поиска и определения объектов на фото.
Фильтр свёртки — небольшая квадратная матрица, которая выделяет квадрат такого же размера из всего массива пикселей изображения и «скользит» по изображению. При этом на каждом шаге выполняются математические операции, такие как умножение и суммирование значений пикселей и элементов фильтра, что позволяет выделять важные признаки объекта.
Матрица — прямоугольная числовая таблица, в ячейках которой находятся числа.
Вес фильтра — значение каждого элемента фильтра, которое определяет степень влияния этого элемента на результат операции свёртки.
Object Classification — нейросеть для классификации объектов на изображении.
Обучение нейросети — процесс, в ходе которого модель (нейросеть) обучается распознавать паттерны и делать предсказания на основе данных.
Датасет — набор данных, которые собраны и организованы для конкретной задачи или исследования. Датасеты используются в различных видах анализа и машинного обучения.
Фрикулинг — способ охлаждения компьютеров и серверов в дата-центрах за счёт использования воздуха с улицы.
Отказоустойчивость — свойство машины сохранять работоспособность, даже если есть неисправность.
Масштабирование — процесс увеличения количества серверов, при котором разработчики могут подключать новые устройства без ограничений для обработки большого количества данных.
Серверная стойка — металлическая конструкция, которая используется для хранения серверов. Она обеспечивает удобную организацию техники и создаёт необходимые условия для работы компьютеров.
Терабайт — единица измерения количества информации. 1 терабайт (ТБ) — это 1 024 гигабайта (ГБ). Столько весят примерно 2 000 полнометражных фильмов или 250 000 песен.
Запрос на сервер — сообщение, которое отправляется на сервер для выполнения на нём каких‑либо действий.
Машинное обучение — направление искусственного интеллекта, в котором компьютерные системы обучаются на данных и совершенствуются с помощью опыта.
Исторические данные — информация, которую используют разработчики для анализа прошедшей работы серверов и программ. Включают в себя данные о нагрузке на серверы, причинах поломок и неисправностей, возможных уязвимых точках системы.
Автоматизация — использование технологий для того, чтобы процессы и задачи, обычно выполняемые человеком, выполнялись без его участия. Сегодня автоматизация чаще всего связана с применением компьютера и специальных программ.
Большие данные (Big data) — разнообразные массивы информации, которые слишком велики или сложны для обработки обычными способами. Для их анализа используют специальные технологии и программы.
Вес фильтра — значение каждого элемента фильтра, которое определяет степень влияния этого элемента на результат операции свёртки.
Вычислительные мощности — производительность устройства, оценка его способности выполнять вычисления и обрабатывать данные за определённый период времени.
Вычислительные ресурсы — аппаратные и программные компоненты компьютера, которые используются для выполнения вычислений и обработки данных.
Графический процессор (GPU) — специализированная электронная схема, которая оптимизирована для быстрой обработки большого объёма данных, необходимых для графических приложений.
Датасет — набор данных, которые собраны и организованы для конкретной задачи или исследования. Датасеты используются в различных видах анализа и машинного обучения.
Дата-центр — здание или комплекс зданий, предназначенные для размещения специальных компьютеров и другого оборудования для хранения, обработки и распространения данных.
Дообучение нейросети — процесс, когда нейросеть учится на новых данных, чтобы лучше выполнять освоенные задачи.
Запрос на сервер — сообщение, которое отправляется на сервер для выполнения на нём каких‑либо действий.
Исторические данные — информация, которую используют разработчики для анализа прошедшей работы серверов и программ. Включают в себя данные о нагрузке на серверы, причинах поломок и неисправностей, возможных уязвимых точках системы.
Компьютерное зрение — набор методов, позволяющих компьютеру извлекать информацию из изображения: определять объект и его местоположение.
Матрица — прямоугольная числовая таблица, в ячейках которой находятся числа.
Масштабирование — процесс увеличения количества серверов, при котором разработчики могут подключать новые устройства без ограничений для обработки большого количества данных.
Машинное обучение — направление искусственного интеллекта, в котором компьютерные системы обучаются на данных и совершенствуются с помощью опыта.
Нейросеть — математическая модель и основанная на ней программа, обрабатывающие данные способом, максимально приближённым к тому, как это делает человеческий мозг.
Object Classification — нейросеть для классификации объектов на изображении.
Object Detection — нейросеть для поиска и определения объектов на фото.
Облачные сервисы — заранее настроенное в Облаке и готовое к использованию программное обеспечение, которое позволяет пользователю решать конкретные IT-задачи.
Облачные технологии (Облако) — это услуга, с помощью которой пользователь по Сети получает доступ к вычислительным ресурсам (процессоры, оперативная память, дисковое пространство, сетевые соединения), сервисам или программам и может пользоваться ими для решения своих IT-задач.
Обучение нейросети — процесс, в ходе которого модель (нейросеть) обучается распознавать паттерны и делать предсказания на основе данных.
Отказоустойчивость — свойство машины сохранять работоспособность, даже если есть неисправность.
Персональный компьютер — стационарное или переносное (ноутбук, планшет) вычислительное устройство, предназначенное для индивидуального использования.
Пиксель — термин, получившийся из первых слогов двух английских слов picture и element, и означающий «элемент изображения». Характеризуется координатами и значениями яркости и цвета.
Программное обеспечение — набор инструкций, благодаря которым компьютер понимает, как работать.
Свёртка — математическая операция, которая используется в нейросетях для выделения признаков объектов.
Свёрточная нейросеть — класс нейронных сетей, специализирующихся на обработке изображений и видео за счёт осуществления операции свёртки.
Сервер — устройство, которое обладает высокой производительностью, хранит большое количество данных и по запросу может предоставлять доступ к ним другим устройствам.
Серверная стойка — металлическая конструкция, которая используется для хранения серверов. Она обеспечивает удобную организацию техники и создаёт необходимые условия для работы компьютеров.
Сетевое оборудование — физические устройства, которые используются для подключения компьютеров друг к другу и к Сети, позволяя им обмениваться информацией и ресурсами.
Терабайт — единица измерения количества информации. 1 терабайт (ТБ) — это 1 024 гигабайта (ГБ). Столько весят примерно 2 000 полнометражных фильмов или 250 000 песен.
Фильтр свёртки — небольшая квадратная матрица, которая выделяет квадрат такого же размера из всего массива пикселей изображения и «скользит» по изображению. При этом на каждом шаге выполняются математические операции, такие как умножение и суммирование значений пикселей и элементов фильтра, что позволяет выделять важные признаки объекта.
Фотоловушка — фотоаппарат, спроектированный для долгой автономной работы (т. е. съёмки без участия человека). Имеет специальный датчик, реагирующий на движение (движение животного, полёт птицы, колыхание травы), благодаря которому делается снимок.
Фрикулинг — способ охлаждения компьютеров и серверов в дата-центрах за счёт использования воздуха с улицы.
Хранилище данных — система хранения и управления большими объёмами структурированных и неструктурированных данных.
Администратор баз данных
Но чтобы всё это действительно работало как часы и анализ больших объёмов данных занимал мало времени, нужно грамотно настроить сбор, хранение и передачу данных внутри облачных сервисов. С этой задачей работает администратор баз данных.
Каждый из нас не задумываясь сможет проанализировать любое изображение: что на нём? Какого оно размера и цвета? Какая у него форма и текстура? Не прошло и секунды, а цельный образ сложился у нас в голове. Так уж устроено человеческое зрение — мы легко улавливаем признаки объектов. В IT эти признаки называются высокоуровневыми.
Компьютер же воспринимает картинку иначе — для него это набор пикселей. При этом пиксели закодированы — каждый имеет числовое значение.
Благодаря выделению высокоуровневых признаков такая нейросеть решает задачу распознавания объекта (например, ирбиса) на фотографии, поэтому называется Object Detection. В Облаке нейронные сети можно развернуть в сервисе DataSphere.
Задание
Посмотрите на пиксели, у которых есть числовые значения, и ответьте на вопрос.
Какое числовое значение имеет выделенный пиксель?
Теперь разберёмся со свёрткой — процессом, давшим название свёрточным нейросетям. Свёртка выделяет признаки объекта на снимках, чтобы затем по ним опознать этот объект.
Эта операция осуществляется с помощью фильтра свёртки — квадратной матрицы чисел. Эти числа подбираются в ходе обучения нейросети (подробнее об этом смотрите в главе «Обучение нейросети»). Фильтр свёртки накладывается на фрагмент изображения такого же размера, и дальше происходит магия математики.
Допустим, у пикселя было значение 4, а у соответствующего окошка фильтра свёртки — 0. Путём нехитрых вычислений получим 0.
Допустим, фильтр свёртки — это квадрат 3 × 3, выделил он 9 пикселей. Это значит, что мы получили 9 новых произведений: значения пикселя со значением фильтра. Теперь эти произведения складываются друг с другом, и итоговое значение попадает в центральный пиксель выбранного квадрата.
Так фильтр проходится по всем фрагментам изображения.
Задание
А теперь сложим все полученные значения.
Например, начальные слои могут выделять края и границы, средние — текстуры и простые узоры, а более глубокие слои — высокоуровневые признаки.
После прохождения через достаточное количество слоёв модель сможет распознать такие детали, как ушко или хвостик животного, а затем определить, что перед ней снежный барс.