5 | Page | 莫叶何竹🍀

🔀Ross随机过程笔记（三）: 随机过程

1 随机过程的定义，离散随机过程、连续随机过程、随机场 2 随机游走 3 随机过程有限维分布定义、性质（对称性，相容性）、Kolmogorv定理 4 随机过程数字特征。均值函数、协方差函数、方差函数、二阶矩过程定义。 5 随机过程基本类型。平稳过程（严平稳过程、宽平稳过程定义）、独立增量过程、平稳增量过程、独立平稳增量过程。

随机过程

Google Universal Image Embedding前五名方案小结

谷歌通用图像embedding竞赛前五名方案小结

图像搜索

表征学习

Matryoshka Representation Learning (俄罗斯套娃表征学习)技术小结

我们平时做retrieval相关的工作，很多时候根据业务场景和计算资源需要对向量进行降维。受限开发周期，我们往往不会通过重新训练特征提取模型来调整向量维度，而是用PCA等方法来实现。但是当降维的scale较大时，PCA等方法的效果较差。Matryoshka Representation Learning （MRL）这篇paper介绍了一个很简单但有效的方法能实现一次训练，获取不同维度的表征提取。下面来看它具体是怎么做的吧。

DreamSim技术小结

针对模型计算的相似性和human perceptual similarity还是有一定的差距的问题，本文提出一个新的指标Dreamsim。Dreamsim更forcus前景和语义信息等high level的特征，并兼顾color、layout等low level特征，能更好的对齐human perceptual similarity。

表征学习

Supervised Contrastive Learning

经典的自监督对比学习方法以instance discrimination作为pretext task。在这种方法中，会对batch的图片进行数据增强，以同一图片不同的数据增强为正例，其它作为负例，以自监督对比损失(式1)作为训练目标进行学习。然而，在某些特定场景下，我们可能已经掌握了类别标签信息，或者至少能够明确哪些实例属于同一类别，而无需具体的类名。在这种情况下，直接沿用传统的自监督对比学习方法进行优化，显然未能充分利用这些宝贵的先验知识。为了解决这一问题，supervised contrastive learning应运而生。其核心思想在于，将传统的自监督对比学习框架扩展至包含正例信息的场景中。该方法从同一类别中进行采样来构建正例。

图像搜索

表征学习

表格结构还原——SLANet

SLANet 是一个轻量级的表格结构识别模型。它将表格结构识别任务建模为序列标注，以自回归的方式预测表格的html序列和单元格位置。

ocr

表格结构还原

阅读顺序还原技术剖析——LayoutReader

给定一张文档图像（可选）及其中全部词级 token 的文本（可选）和bounding box，输出一个排列后的 token 顺序，使其符合人类自然阅读顺序。形式化：给定一组无序的box序列，$\{t_i=(x^i_0, y^i_0, x^i_1, y^i_1)\}$，求解排列 $\pi$ 使得 $[t_{\pi(1)}, t_{\pi(2)}, …]$为正确阅读顺序。

ocr

版面恢复