Тензорный скетч

Тензорный скетч (англ. tensor sketch) — метод уменьшения размерности, используемый в статистике, машинном обучении и алгоритмах обработки больших данных^[1]^[2]. Он особенно эффективен применительно к векторам, имеющим тензорную структуру. Такой скетч может быть использован для ускорения билинейного объединения в нейронных сетях и является краеугольным камнем во многих алгоритмах числовой линейной алгебры^[3].

История

Термин тензорный скетч (эскиз) был придуман в 2013 г.^[4] и в том же году описан как метод Расмусом Пегом^[5].

Сначала соответствующий метод базировался на использовании быстрого преобразования Фурье, чтобы реализовать быструю свёртку аналогично отсчётному скетчу. В результате дальнейших исследований его обобщили на значительно больший класс методов уменьшения размерности с помощью случайных тензорных проекций.

Тензорные проекции

В основе одного из вариантов тензорного скетча лежит применение торцевого произведения матриц, предложенного Слюсарем В. И.^[6] в 1996 г. (англ. face-splitting product)^[7]^[8]^[9]^[10]^[11].

Торцевое произведение двух матриц с однаковым количеством строк $\mathbf {C} \in \mathbb {R} ^{3\times 3}$ и $\mathbf {D} \in \mathbb {R} ^{3\times 3}$ имеет вид^[7]^[8]^[9]^[12]: $\mathbf {C} \bullet \mathbf {D} =\left[{\begin{array}{c }\mathbf {C} _{1}\otimes \mathbf {D} _{1}\\\hline \mathbf {C} _{2}\otimes \mathbf {D} _{2}\\\hline \mathbf {C} _{3}\otimes \mathbf {D} _{3}\\\end{array}}\right]=\left[{\begin{array}{c c c c c c c c c }\mathbf {C} _{1,1}\mathbf {D} _{1,1}&\mathbf {C} _{1,1}\mathbf {D} _{1,2}&\mathbf {C} _{1,1}\mathbf {D} _{1,3}&\mathbf {C} _{1,2}\mathbf {D} _{1,1}&\mathbf {C} _{1,2}\mathbf {D} _{1,2}&\mathbf {C} _{1,2}\mathbf {D} _{1,3}&\mathbf {C} _{1,3}\mathbf {D} _{1,1}&\mathbf {C} _{1,3}\mathbf {D} _{1,2}&\mathbf {C} _{1,3}\mathbf {D} _{1,3}\\\hline \mathbf {C} _{2,1}\mathbf {D} _{2,1}&\mathbf {C} _{2,1}\mathbf {D} _{2,2}&\mathbf {C} _{2,1}\mathbf {D} _{2,3}&\mathbf {C} _{2,2}\mathbf {D} _{2,1}&\mathbf {C} _{2,2}\mathbf {D} _{2,2}&\mathbf {C} _{2,2}\mathbf {D} _{2,3}&\mathbf {C} _{2,3}\mathbf {D} _{2,1}&\mathbf {C} _{2,3}\mathbf {D} _{2,2}&\mathbf {C} _{2,3}\mathbf {D} _{2,3}\\\hline \mathbf {C} _{3,1}\mathbf {D} _{3,1}&\mathbf {C} _{3,1}\mathbf {D} _{3,2}&\mathbf {C} _{3,1}\mathbf {D} _{3,3}&\mathbf {C} _{3,2}\mathbf {D} _{3,1}&\mathbf {C} _{3,2}\mathbf {D} _{3,2}&\mathbf {C} _{3,2}\mathbf {D} _{3,3}&\mathbf {C} _{3,3}\mathbf {D} _{3,1}&\mathbf {C} _{3,3}\mathbf {D} _{3,2}&\mathbf {C} _{3,3}\mathbf {D} _{3,3}\end{array}}\right].$

Целесообразность использования этого произведения заключается в его свойстве:

(\mathbf {C} \bullet \mathbf {D} )(x\otimes y)=\mathbf {C} x\circ \mathbf {D} y=\left[{\begin{array}{c }(\mathbf {C} x)_{1}(\mathbf {D} y)_{1}\\(\mathbf {C} x)_{2}(\mathbf {D} y)_{2}\\\vdots \end{array}}\right],

где $\circ$ — поэлементное произведение Адамара.

На этой основе произвольный тензорный скетч вида $\mathbf {M} (y\otimes z)$ можно представить как $\mathbf {M'} y\circ \mathbf {M''} z$ , где матрицы $\mathbf {M'}$ и $\mathbf {M''}$ имеют меньшую размерность, и $\mathbf {M'} \bullet \mathbf {M''} =\mathbf {M}$ . Поскольку операции $\mathbf {M'} y$ и $\mathbf {M''} z$ выполнимы за линейное время $kd_{1}$ и $kd_{2}$ соответственно, переход к представлению $\mathbf {M'} \bullet \mathbf {M''}$ позволяет выполнить умножение на векторы с тензорной структурой намного быстрее, чем формируется исходное выражение $\mathbf {M} (y\otimes z)$ , а именно за время $kd=kd_{1}d_{2}$ .

Для тензоров более высокого порядка, например, $x=y\otimes z\otimes t$ , экономия будет ещё более значимой.

Подобное преобразование удовлетворяет лемме о малых искажениях исходных данных большой размерности.

См. также

Примечания

↑ Low-rank Tucker decomposition of large tensors using: Tensor Sketch (неопр.). amath.colorado.edu. Boulder, Colorado: University of Colorado Boulder. Дата обращения: 30 июля 2020. Архивировано 14 февраля 2019 года.
↑ Ahle, Thomas; Knudsen, Jakob Almost Optimal Tensor Sketch (неопр.). Researchgate (3 сентября 2019). Дата обращения: 11 июля 2020. Архивировано 14 июля 2020 года.
↑ Woodruff, David P. «Sketching as a Tool for Numerical Linear Algebra.» Theoretical Computer Science 10.1-2 (2014): 1-157.
↑ Ninh, Pham; Rasmus, Pagh (2013). Fast and scalable polynomial kernels via explicit feature maps. SIGKDD international conference on Knowledge discovery and data mining. Association for Computing Machinery. doi:10.1145/2487575.2487591.
↑ Rasmus, Pagh (2013). "Compressed matrix multiplication". ACM Transactions on Computation Theory, August 2013 Article No.: 9. Association for Computing Machinery. doi:10.1145/2493252.2493254.
↑ Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics — Theory and Methods, 38:19, P. 3501 [1] Архивная копия от 26 апреля 2021 на Wayback Machine
↑ ¹ ² Slyusar, V. I. (December 27, 1996). "End products in matrices in radar applications" (PDF). Radioelectronics and Communications Systems.– 1998, Vol. 41; Number 3: 50—53. Архивировано (PDF) 27 июля 2020. Дата обращения: 30 июля 2020.
↑ ¹ ² Slyusar, V. I. Analytical model of the digital antenna array on a basis of face-splitting matrix products (англ.) // Proc. ICATT- 97, Kyiv : journal. — 1997. — 20 May. — P. 108—109. Архивировано 25 января 2020 года.
↑ ¹ ² Slyusar, V. I. A Family of Face Products of Matrices and its Properties (англ.) // Cybernetics and Systems Analysis C/C of Kibernetika I Sistemnyi Analiz : journal. — 1999. — Vol. 35, no. 3. — P. 379—384. — doi:10.1007/BF02733426. Архивировано 25 января 2020 года.
↑ Slyusar, V. I. Generalized face-products of matrices in models of digital antenna arrays with nonidentical channels (англ.) // Radioelectronics and Communications Systems : journal. — 2003. — Vol. 46, no. 10. — P. 9—17. Архивировано 20 сентября 2020 года.
↑ Миночкин А.И., Рудаков В.И., Слюсар В.И. Основы военно-технических исследований. Теория и приложения. Том. 2. Синтез средств информационного обеспечения вооружения и военной техники//Под ред. А.П. Ковтуненко. - Киев: «Гранмна». – 2012. (неопр.) C. 7 - 98; 354 - 521 (2012). Дата обращения: 30 июля 2020. Архивировано 25 января 2020 года.
↑ Slyusar, V. I. (1997-09-15). "New operations of matrices product for applications of radars" (PDF). Proc. Direct and Inverse Problems of Electromagnetic and Acoustic Wave Theory (DIPED-97), Lviv.: 73—74. Архивировано (PDF) 25 января 2020. Дата обращения: 31 июля 2020.

[1] Low-rank Tucker decomposition of large tensors using: Tensor Sketch (неопр.). amath.colorado.edu. Boulder, Colorado: University of Colorado Boulder. Дата обращения: 30 июля 2020. Архивировано 14 февраля 2019 года.

[2] Ahle, Thomas; Knudsen, Jakob Almost Optimal Tensor Sketch (неопр.). Researchgate (3 сентября 2019). Дата обращения: 11 июля 2020. Архивировано 14 июля 2020 года.

[woodruff-3] Woodruff, David P. «Sketching as a Tool for Numerical Linear Algebra.» Theoretical Computer Science 10.1-2 (2014): 1-157.

[ninh-4] Ninh, Pham; Rasmus, Pagh (2013). Fast and scalable polynomial kernels via explicit feature maps. SIGKDD international conference on Knowledge discovery and data mining. Association for Computing Machinery. doi:10.1145/2487575.2487591.

[pagh-5] Rasmus, Pagh (2013). "Compressed matrix multiplication". ACM Transactions on Computation Theory, August 2013 Article No.: 9. Association for Computing Machinery. doi:10.1145/2493252.2493254.

[Fortiana-6] Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics — Theory and Methods, 38:19, P. 3501 [1] Архивная копия от 26 апреля 2021 на Wayback Machine

[slyusar-7] ¹ ² Slyusar, V. I. (December 27, 1996). "End products in matrices in radar applications" (PDF). Radioelectronics and Communications Systems.– 1998, Vol. 41; Number 3: 50—53. Архивировано (PDF) 27 июля 2020. Дата обращения: 30 июля 2020.

[slyusar1-8] ¹ ² Slyusar, V. I. Analytical model of the digital antenna array on a basis of face-splitting matrix products (англ.) // Proc. ICATT- 97, Kyiv : journal. — 1997. — 20 May. — P. 108—109. Архивировано 25 января 2020 года.

[slyusar2-9] ¹ ² Slyusar, V. I. A Family of Face Products of Matrices and its Properties (англ.) // Cybernetics and Systems Analysis C/C of Kibernetika I Sistemnyi Analiz : journal. — 1999. — Vol. 35, no. 3. — P. 379—384. — doi:10.1007/BF02733426. Архивировано 25 января 2020 года.

[10] Slyusar, V. I. Generalized face-products of matrices in models of digital antenna arrays with nonidentical channels (англ.) // Radioelectronics and Communications Systems : journal. — 2003. — Vol. 46, no. 10. — P. 9—17. Архивировано 20 сентября 2020 года.

[slyusarsmartantenna1-11] Миночкин А.И., Рудаков В.И., Слюсар В.И. Основы военно-технических исследований. Теория и приложения. Том. 2. Синтез средств информационного обеспечения вооружения и военной техники//Под ред. А.П. Ковтуненко. - Киев: «Гранмна». – 2012. (неопр.) C. 7 - 98; 354 - 521 (2012). Дата обращения: 30 июля 2020. Архивировано 25 января 2020 года.

[DIPED-12] Slyusar, V. I. (1997-09-15). "New operations of matrices product for applications of radars" (PDF). Proc. Direct and Inverse Problems of Electromagnetic and Acoustic Wave Theory (DIPED-97), Lviv.: 73—74. Архивировано (PDF) 25 января 2020. Дата обращения: 31 июля 2020.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

Искусственный интеллект
История	История искусственного интеллекта Зима искусственного интеллекта Дартмутский семинар Регламент ЕС об искусственном интеллекте
Философия	Тест Тьюринга Китайская комната Сильный и слабый искусственные интеллекты Дружественный искусственный интеллект Этика искусственного интеллекта Проблема контроля
Направления	Агентный подход Адаптивное управление Инженерия знаний Модель жизнеспособной системы Машинное обучение Нейронная сеть Нечёткая логика Обработка естественного языка Персональный искусственный интеллект Распознавание образов Роевой интеллект Символический ИИ Эволюционные алгоритмы Экспертная система
Применение	Голосовое управление Задача классификации Классификация документов Кластеризация документов Кластерный анализ Локальный поиск Машинный перевод Оптическое распознавание символов Распознавание речи Распознавание рукописного ввода Игровой ИИ
Исследователи	Чарлз Бэббидж Владимир Вапник Джозеф Вейценбаум Норберт Винер Виктор Глушков Владимир Городецкий Ян Лекун Алексей Ляпунов Джон Маккарти Марвин Мински Аллен Ньюэлл Сеймур Пейперт Джуда Перл Гермоген Поспелов Дмитрий Поспелов Фрэнк Розенблатт Герберт Александер Саймон Алан Тьюринг Патрик Уинстон Виктор Финн Сергей Фомин Демис Хассабис Джеффри Хинтон Ноам Хомский Клод Шеннон Эндрю Ын Элиезер Юдковский

Машинное обучение и data mining
Задачи	Задача классификации Обучение без учителя Обучение с частичным привлечением учителя Регрессионный анализ AutoML Ассоциативные правила Выделение признаков Обучение признакам Обучение ранжированию Грамматический вывод Онлайновое обучение
Обучение с учителем	Метод k ближайших соседей Наивный байесовский классификатор Дерево решений Метод опорных векторов Линейная регрессия Логистическая регрессия Перцептрон Ансамблевое обучение Бэггинг Бустинг Метод случайного леса Метод релевантных векторов
Кластерный анализ	Метод k-средних Метод нечёткой кластеризации Иерархическая кластеризация EM-алгоритм BIRCH CURE DBSCAN OPTICS Mean-shift
Снижение размерности	Факторный анализ Метод главных компонент CCA ICA LDA Неотрицательное матричное разложение t-SNE
Структурное прогнозирование	Графовая вероятностная модель Байесовская сеть Скрытая марковская модель CRF
Выявление аномалий	Метод k ближайших соседей Локальный уровень выброса
Графовые вероятностные модели	Байесовская сеть Марковская сеть Скрытая марковская модель
Нейронные сети	Ограниченная машина Больцмана Самоорганизующаяся карта Функция активации Сигмоида Softmax Радиально-базисная функция Метод обратного распространения ошибки Глубокое обучение Многослойный перцептрон Рекуррентная нейронная сеть Долгая краткосрочная память Управляемый рекуррентный блок Свёрточная нейронная сеть U-Net Автокодировщик
Обучение с подкреплением	Марковский процесс Уравнение Беллмана Жадный алгоритм Q-обучение SARSA Temporal difference (TD)
Теория	Размерность Вапника — Червоненкиса Дилемма смещения–дисперсии Теория вычислительного обучения Минимизация эмпирического риска Оккамово обучение PAC learning Статистическая теория обучения
Журналы и конференции	NeurIPS ICML ML JMLR ArXiv:cs.LG

Тензорный скетч

Содержание

История

Тензорные проекции

См. также

Примечания

Навигация

Тензорный скетч

История

Тензорные проекции

См. также

Примечания

Навигация

Поиск