Тензорный скетч может использоваться для уменьшения количества переменных, необходимых для реализации билинейного пулинга в нейронной сети
Тензорный скетч (англ.tensor sketch) — метод уменьшения размерности, используемый в статистике, машинном обучении и алгоритмах обработки больших данных[1][2]. Он особенно эффективен применительно к векторам, имеющим тензорную структуру. Такой скетч может быть использован для ускорения билинейного объединения в нейронных сетях и является краеугольным камнем во многих алгоритмах числовой линейной алгебры[3].
Термин тензорный скетч (эскиз) был придуман в 2013 г.[4] и в том же году описан как метод Расмусом Пегом[5].
Сначала соответствующий метод базировался на использовании быстрого преобразования Фурье, чтобы реализовать быструю свёртку аналогично отсчётному скетчу.
В результате дальнейших исследований его обобщили на значительно больший класс методов уменьшения размерности с помощью случайных тензорных проекций.
На этой основе произвольный тензорный скетч вида можно представить как , где матрицы и имеют меньшую размерность, и .
Поскольку операции и выполнимы за линейное время и соответственно, переход к представлению позволяет выполнить умножение на векторы с тензорной структурой намного быстрее, чем формируется исходное выражение , а именно за время .
Для тензоров более высокого порядка, например, , экономия будет ещё более значимой.
Подобное преобразование удовлетворяет лемме о малых искажениях исходных данных большой размерности.
↑Woodruff, David P. «Sketching as a Tool for Numerical Linear Algebra.» Theoretical Computer Science 10.1-2 (2014): 1-157.
↑Ninh, Pham; Rasmus, Pagh (2013). Fast and scalable polynomial kernels via explicit feature maps. SIGKDD international conference on Knowledge discovery and data mining. Association for Computing Machinery. doi:10.1145/2487575.2487591.
↑
Rasmus, Pagh (2013). Compressed matrix multiplication. ACM Transactions on Computation Theory, August 2013 Article No.: 9. Association for Computing Machinery. doi:10.1145/2493252.2493254.
↑Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics — Theory and Methods, 38:19, P. 3501 [1]Архивная копия от 26 апреля 2021 на Wayback Machine