• 集合相似性度量方式:
  • 向量相似性度量方式:
    • 欧式距离
    • 曼哈顿距离
    • 切比雪夫距离
    • ⻢哈拉诺⽐斯距离【马氏距离(Mahalanobis Distance)是由马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。】 https://blog.csdn.net/fu_jian_ping/article/details/111877248
    • SMC(用于bool向量)
  • 信息量
    • 概率越小,包含的信息越多
    • 将概率换成频率后,可以衡量一个数据表的信息量