123

123

123

Фотоловушка — фотоаппарат, спроектированный для долгой автономной работы (т. е. съёмки без участия человека). Имеет специальный датчик, реагирующий на движение (движение животного, полёт птицы, колыхание травы), благодаря которому делается снимок.

Автоматизация — использование технологий для того, чтобы процессы и задачи, обычно выполняемые человеком, выполнялись без его участия. Сегодня автоматизация чаще всего связана с применением компьютера и специальных программ.

Нейросеть — математическая модель и основанная на ней программа, обрабатывающие данные способом, максимально приближенным к тому, как это делает человеческий мозг.

Облачные технологии (Облако) — это услуга, с помощью которой пользователь по сети получает доступ к вычислительным ресурсам (процессоры, оперативная память, дисковое пространство, сетевые соединения), сервисам или программам и может пользоваться ими для решения своих IT-задач.

Персональный компьютер — стационарное или переносное (ноутбук, планшет) вычислительное устройство, предназначенное для индивидуального использования.

Вычислительные мощности — производительность устройства, оценка его способности выполнять вычисления и обрабатывать данные за определённый период времени.

Вычислительные ресурсы — аппаратные и программные компоненты компьютера, которые используются для выполнения вычислений и обработки данных.

Дата-центр — здание или комплекс зданий, предназначенные для размещения специальных компьютеров и другого оборудования для хранения, обработки и распространения данных.

Большие данные (Big Data) — разнообразные массивы информации, которые слишком велики или сложны для обработки обычными способами. Для их анализа используют специальные технологии и программы.

Облачные сервисы — заранее настроенное в Облаке и готовое к использованию программное обеспечение, которое позволяет пользователю решать конкретные IT-задачи.

Графический процессор (GPU) — специализированная электронная схема, которая оптимизирована для быстрой обработки большого объёма данных, необходимых для графических приложений.

Компьютерное зрение — набор методов, позволяющих компьютеру извлекать информацию из изображения: определять объект и его местоположение.

Пиксель — термин, получившийся из первых слогов двух английских слов picture и element и означающий «элемент изображения». Характеризуется координатами и значениями яркости и цвета.

Свёртка — математическая операция, которая используется в нейросетях для выделения признаков объектов.

Object Detection — нейросеть для поиска и определения объектов на фото.

Фильтр свёртки — небольшая квадратная матрица, которая выделяет квадрат такого же размера из всего массива пикселей изображения и «скользит» по изображению. При этом на каждом шаге выполняются математические операции, такие как умножение и суммирование значений пикселей и элементов фильтра, что позволяет выделять важные признаки объекта.

Матрица — прямоугольная числовая таблица, в ячейках которой находятся числа.

Вес фильтра — значение каждого элемента фильтра, которое определяет степень влияния этого элемента на результат операции свёртки.

Object Classification — нейросеть для классификации объектов на изображении.

Обучение нейросети — процесс, в ходе которого модель (нейросеть) обучается распознавать паттерны и делать предсказания на основе данных.

Датасет — набор данных, которые собраны и организованы для конкретной задачи или исследования. Датасеты используются в различных видах анализа и машинного обучения.

Фрикулинг — способ охлаждения компьютеров и серверов в дата-центрах за счёт использования воздуха с улицы.

Отказоустойчивость — свойство машины сохранять работоспособность, даже если есть неисправность.

Масштабирование — процесс увеличения количества серверов, при котором разработчики могут подключать новые устройства без ограничений для обработки большого количества данных.

Серверная стойка — металлическая конструкция, которая используется для хранения серверов. Она обеспечивает удобную организацию техники и создаёт необходимые условия для работы компьютеров.

Терабайт — единица измерения количества информации. 1 терабайт (ТБ) — это 1 024 гигабайта (ГБ). Столько весят примерно 2 000 полнометражных фильмов или 250 000 песен.

Запрос на сервер — сообщение, которое отправляется на сервер для выполнения на нём каких‑либо действий.

Машинное обучение — направление искусственного интеллекта, в котором компьютерные системы обучаются на данных и совершенствуются с помощью опыта.

Исторические данные — информация, которую используют разработчики для анализа прошедшей работы серверов и программ. Включают в себя данные о нагрузке на серверы, причинах поломок и неисправностей, возможных уязвимых точках системы.

А

Автоматизация — использование технологий для того, чтобы процессы и задачи, обычно выполняемые человеком, выполнялись без его участия. Сегодня автоматизация чаще всего связана с применением компьютера и специальных программ.

Б

Большие данные (Big data) — разнообразные массивы информации, которые слишком велики или сложны для обработки обычными способами. Для их анализа используют специальные технологии и программы.

В

Вес фильтра — значение каждого элемента фильтра, которое определяет степень влияния этого элемента на результат операции свёртки.

Вычислительные мощности — производительность устройства, оценка его способности выполнять вычисления и обрабатывать данные за определённый период времени.

Вычислительные ресурсы — аппаратные и программные компоненты компьютера, которые используются для выполнения вычислений и обработки данных.

Г

Графический процессор (GPU) — специализированная электронная схема, которая оптимизирована для быстрой обработки большого объёма данных, необходимых для графических приложений.

Д

Датасет — набор данных, которые собраны и организованы для конкретной задачи или исследования. Датасеты используются в различных видах анализа и машинного обучения.

Дата-центр — здание или комплекс зданий, предназначенные для размещения специальных компьютеров и другого оборудования для хранения, обработки и распространения данных.

Дообучение нейросети — процесс, когда нейросеть учится на новых данных, чтобы лучше выполнять освоенные задачи.

З

Запрос на сервер — сообщение, которое отправляется на сервер для выполнения на нём каких‑либо действий.

И

Исторические данные — информация, которую используют разработчики для анализа прошедшей работы серверов и программ. Включают в себя данные о нагрузке на серверы, причинах поломок и неисправностей, возможных уязвимых точках системы.

К

Компьютерное зрение — набор методов, позволяющих компьютеру извлекать информацию из изображения: определять объект и его местоположение.

М

Матрица — прямоугольная числовая таблица, в ячейках которой находятся числа.

Масштабирование — процесс увеличения количества серверов, при котором разработчики могут подключать новые устройства без ограничений для обработки большого количества данных.

Машинное обучение — направление искусственного интеллекта, в котором компьютерные системы обучаются на данных и совершенствуются с помощью опыта.

Н

Нейросеть — математическая модель и основанная на ней программа, обрабатывающие данные способом, максимально приближённым к тому, как это делает человеческий мозг.

О

Object Classification — нейросеть для классификации объектов на изображении.

Object Detection — нейросеть для поиска и определения объектов на фото.

Облачные сервисы — заранее настроенное в Облаке и готовое к использованию программное обеспечение, которое позволяет пользователю решать конкретные IT-задачи.

Облачные технологии (Облако) — это услуга, с помощью которой пользователь по Сети получает доступ к вычислительным ресурсам (процессоры, оперативная память, дисковое пространство, сетевые соединения), сервисам или программам и может пользоваться ими для решения своих IT-задач.

Обучение нейросети — процесс, в ходе которого модель (нейросеть) обучается распознавать паттерны и делать предсказания на основе данных.

Отказоустойчивость — свойство машины сохранять работоспособность, даже если есть неисправность.

П

Персональный компьютер — стационарное или переносное (ноутбук, планшет) вычислительное устройство, предназначенное для индивидуального использования.

Пиксель — термин, получившийся из первых слогов двух английских слов picture и element, и означающий «элемент изображения». Характеризуется координатами и значениями яркости и цвета.

Программное обеспечение — набор инструкций, благодаря которым компьютер понимает, как работать.

С

Свёртка — математическая операция, которая используется в нейросетях для выделения признаков объектов.

Свёрточная нейросеть — класс нейронных сетей, специализирующихся на обработке изображений и видео за счёт осуществления операции свёртки.

Сервер — устройство, которое обладает высокой производительностью, хранит большое количество данных и по запросу может предоставлять доступ к ним другим устройствам.

Серверная стойка — металлическая конструкция, которая используется для хранения серверов. Она обеспечивает удобную организацию техники и создаёт необходимые условия для работы компьютеров.

Сетевое оборудование — физические устройства, которые используются для подключения компьютеров друг к другу и к Сети, позволяя им обмениваться информацией и ресурсами.

Т

Терабайт — единица измерения количества информации. 1 терабайт (ТБ) — это 1 024 гигабайта (ГБ). Столько весят примерно 2 000 полнометражных фильмов или 250 000 песен.

Ф

Фильтр свёртки — небольшая квадратная матрица, которая выделяет квадрат такого же размера из всего массива пикселей изображения и «скользит» по изображению. При этом на каждом шаге выполняются математические операции, такие как умножение и суммирование значений пикселей и элементов фильтра, что позволяет выделять важные признаки объекта.

Фотоловушка — фотоаппарат, спроектированный для долгой автономной работы (т. е. съёмки без участия человека). Имеет специальный датчик, реагирующий на движение (движение животного, полёт птицы, колыхание травы), благодаря которому делается снимок.

Фрикулинг — способ охлаждения компьютеров и серверов в дата-центрах за счёт использования воздуха с улицы.

Х

Хранилище данных — система хранения и управления большими объёмами структурированных и неструктурированных данных.

Сегодня компьютерное зрение активно применяется для решения самых разнообразных задач. Сохранение редких видов животных — одна из них.
Итак, все процессы налажены. Самое время разобраться с компьютерным зрением.

Каждый из нас не задумываясь сможет проанализировать любое изображение: что на нём? Какого оно размера и цвета? Какая у него форма и текстура? Не прошло и секунды, а цельный образ сложился у нас в голове. Так уж устроено человеческое зрение — мы легко улавливаем признаки объектов. В IT эти признаки называются высокоуровневыми.

Компьютер же воспринимает картинку иначе — для него это набор пикселей. При этом пиксели закодированы — каждый имеет числовое значение.

А теперь вопрос: как научить компьютер анализировать картинку как человек?
Сегодня для анализа изображений с помощью компьютерного зрения чаще всего используются нейросети — их обучают распознавать те самые высокоуровневые характеристики объекта и выделять закономерности.
Эти нейросети могут быть разными, но самыми эффективными на настоящий момент являются свёрточные.

Благодаря выделению высокоуровневых признаков такая нейросеть решает задачу распознавания объекта (например, ирбиса) на фотографии, поэтому называется Object Detection. В Облаке нейронные сети можно развернуть в сервисе DataSphere.

Вы помните, что каждый пиксель изображения для компьютера закодирован? Числовое значение пикселя содержит информацию о его цвете и интенсивности. Например, чёрно-белая фотография содержит только оттенки серого, и каждый её пиксель будет закодирован числом, отражающим его яркость: от чёрного до белого.

Задание

Посмотрите на пиксели, у которых есть числовые значения, и ответьте на вопрос.

1 из 3

Какое числовое значение имеет выделенный пиксель?

4
25
16
1
7
22
5
12
25
Отлично! Со значениями пикселей разобрались.

Теперь разберёмся со свёрткой — процессом, давшим название свёрточным нейросетям. Свёртка выделяет признаки объекта на снимках, чтобы затем по ним опознать этот объект.

Эта операция осуществляется с помощью фильтра свёртки — квадратной матрицы чисел. Эти числа подбираются в ходе обучения нейросети (подробнее об этом смотрите в главе «Обучение нейросети»). Фильтр свёртки накладывается на фрагмент изображения такого же размера, и дальше происходит магия математики.

Значения фильтра свёртки накладываются на значения пикселей, и происходит их попарное перемножение: число пикселя умножается на соответствующий вес фильтра.
Эта операция проводится с каждым пикселем, когда по нему проходит фильтр.
Затем результаты всех произведений «пиксель × фильтр» складываются.
Получается, что 9 пикселей как бы сворачиваются в один новый. Именно поэтому операция и называется «свёртка».

Так фильтр проходится по всем фрагментам изображения.

Задание

А теперь сложим все полученные значения.

16
0
-8
7
Компьютер выполняет свёртку изображения несколько раз, проходя через несколько слоёв, каждый из которых имеет свои фильтры с разными весами. Каждый слой может выделять множество различных признаков.

Например, начальные слои могут выделять края и границы, средние — текстуры и простые узоры, а более глубокие слои — высокоуровневые признаки.

После прохождения через достаточное количество слоёв модель сможет распознать такие детали, как ушко или хвостик животного, а затем определить, что перед ней снежный барс.

Mon Dec 23 2024 16:51:51 GMT+0300 (Moscow Standard Time)