2021
- 2021-09-11天马行空:设计自己的激活函数
- 2021-09-07函数光滑近似(4):Heaviside step函数及其应用
- 2021-08-24引入参数控制softmax的smooth程度
- 2021-08-23分析与拓展:多分类模型的输出为什么使用softmax?
- 2021-08-19一种基于光滑逼近的正态分布采样法
- 2021-08-15GELU由来:从狄拉克函数到GELU激活函数
- 2021-08-12Lp范数的上下界分析
- 2021-08-12logsumexp函数分析
- 2021-06-08分析Mish激活函数的设计思路
- 2021-03-20形形色色的Sigmoid(S型)函数
2020
- 2020-11-11使用神经网络进行分布变换
- 2020-08-22floor、ceil、round、trunc函数都是什么?
- 2020-07-23采样(四):从正态分布构造均匀分布
- 2020-07-15时间序列都有哪些机器学习任务?
- 2020-05-15max函数光滑逼近:一种与softmax相关的形式
- 2020-02-20随机矩阵正交性证明
- 2020-02-15一文搞懂时间序列多步预测的原理
2019
- 2019-08-30从函数光滑近似的角度统一理解激活函数
- 2019-06-25采样(三):重要性采样与接受拒绝采样
- 2019-06-18采样(二):从正态分布采样
- 2019-06-12采样(一):从均匀分布、指数分布和拉普拉斯分布采样
- 2019-05-18softmax:建立hard-attention到soft-attention的桥梁
- 2019-05-07谈算法工程师的数学素养
- 2019-04-26Google的激活函数Swish是怎么设计出来的?
- 2019-04-25Sigmoid函数导出的另外一个角度
- 2019-04-12函数光滑近似(3):abs函数
- 2019-04-10函数光滑近似(2):softmax与argmax
- 2019-04-08函数光滑近似(1):maximum函数
- 2019-03-10信息聚合漫谈:加权平均思路
2018
- 2018-11-20深度学习中的参数初始化及其数学分析
- 2018-11-18浅谈随机向量与随机矩阵
- 2018-10-30范数正则化的原理分析(二):参数约束与最大熵原理
- 2018-10-29范数正则化的原理分析(一):贝叶斯学派角度
- 2018-10-15Logistic模型及其推广
- 2018-09-26马尔可夫链及其Python实现(补充)
- 2018-09-03最大熵原理、最大熵约束与概率分布
- 2018-08-28漫谈“熵”
- 2018-08-20Minkowski距离、Mahalanobis距离、Wasserstein距离
- 2018-08-10概念:odds vs logits
- 2018-05-26牛顿迭代法的导出