OpenGL Projects
计算机图形学基础大作业
计算机图形学基础大作业
2025年人工智能最大的一个风口就是李飞飞,杨立昆等人追捧的世界模型以及具身智能。考虑大脑运作的方式,如果抽象的将大脑分为硬件(物理功能分区)和软件(神经元之间具体的连接算法)两个部分,我们之前对于深度模型(大语言模型,多模态模型)的尝试一直是仅停留在视觉、听觉,以及文字的信息处理这些方面,但是忽略了人脑占比十分巨大的一个模块:运动模块。可以说,理想中的通用人工智能 AGI 如果要100%的“取代人类”,拥有一个运动模块来理解这个世界、理解人类行为是必不可少的。
VAE(变分自编码器)
GAN(对抗生成网络)
Flows(流模型)
AR(自回归模型)
Diffusion (扩散模型)
其中与 Transformer 相关的 AR 内容在另外一篇文章讨论。
(基于朱军老师的PPT)
无监督学习任务:聚类(Clustering)
K-均值(K-mean)
混合高斯模型(Gaussian Mixture Models, GMM)
EM算法(Expectation-Maximization Algorithm)
评价指标(Evaluation Metrics)
(本文参考朱军老师的《概率机器学习》)