掌握基本面投资艺术:精炼的 prompt 模板

当我们研究和理解一家企业时,往往要从企业的基本问题出发,如业务和产品、资产模式和商业模式等等。但是往往面临浩如烟海的资料、缺乏结构化的信息、缺乏轻重重要性的信息。

那么,有什么方法可以让我们快速理解一家企业,对其建立基本理解?

阅读全文

确定性变量的随机化技巧

有些场景下我们需要把确定性变量转变为随机变量,例如一些策略需要对波动率建模、鲁棒性测试、仿真场景或回测。

但是现实中没有更多可以运用的数据,或者我们期望测试的时候具有确定性,这个在波动率建模中很重要。

那么,如何对确定性变量进行随机化呢?

阅读全文

分析与拓展:Transformer中的MultiHeadAttention为什么使用scaled?

最近遇到一个有趣的问题:就是Transformer中的MultiHeadAttention为什么使用scaled?打算在这个问题上展开来分析并做一些拓展思考。

这些分享一下~

阅读全文

Tensorflow的多卡训练:原理和实践

当我们拥有大量的数据后,尤其是大规模文本、多模态、视频序列数据及其使用大型预训练模型等等情况下,训练好一个模型不得不借助分布式策略来提高计算资源的使用效率,进而缩短模型的训练时间。文本总结一下Tensorflow的分布式多卡训练,包括单机多卡训练与多机的分布式训练。

阅读全文

机器学习之分类问题的评估指标总结

没有测量就没有科学,同样,机器学习任务也离不开评估指标。评估指标一般来源于对业务的抽象,本文总结分类问题中常用的评估指标。

阅读全文

天马行空:设计自己的激活函数

天马行空,发挥想象力,设计自己的激活函数~

阅读全文

函数光滑近似(4):Heaviside step函数及其应用

其实Heaviside step函数在本博客在介绍了很多次,不过比较松散,这篇把它系统梳理一下。

阅读全文

引入参数控制softmax的smooth程度

如何入参数控制softmax的smooth程度?

阅读全文

分析与拓展:多分类模型的输出为什么使用softmax?

多分类模型的输出为什么使用softmax?最近在知乎上看到类似的回答,我觉得都没有说到本质上去,都是在回答why之后的side effect。这里给出我认为满意的解释。

阅读全文

一种基于光滑逼近的正态分布采样法

一种基于光滑逼近正态分布的累积分布函数的采样法

阅读全文

GELU由来:从狄拉克函数到GELU激活函数

Transformer兴起后,GELU激活函数流行起来,即便在CNN模型中,也常见GELU替代RELU。这篇文章从数学角度理解GELU是怎样来的。

阅读全文

Lp范数的上下界分析

一个简单直观Lp范数上下界推导,并获得一个重要的结论。

阅读全文

logsumexp函数分析

logsumexp函数出现在很多地方,今天简单分析该函数。

阅读全文

分析Mish激活函数的设计思路

最近注意到一个称为Mish的激活函数,这里分析一下~

阅读全文

阿尔法经济学:Shiller模型介绍

阿尔法经济学中Shiller模型的介绍,包括两个极限特例。

阅读全文

形形色色的Sigmoid(S型)函数

Sigmoid函数指S型的函数,盘点一下都有哪些?

阅读全文

NER任务的深度总结

总结一下NER任务,包括思路分解、标签集说明、评估指标、编码器、解码方式等等。

阅读全文

序列标注:从HMM、MEMM到CRF

本文从序列标注的角度讲述三个经典的模型:HMM、MEMM(最大熵马尔可夫模型)和CRF,这三个模型都用于解决序列标注问题,其中CRF结合当前的深度学习模型在信息抽取和序列标注任务上已经取得巨大的成功。本文把最大熵模型、HMM、MEMM、CRF串起来讲一讲。

阅读全文

CRF的简洁实现

提供基于Tensorflow2.x的CRF简洁实现,并提供NER、POS、CWS例子。

阅读全文

Grad-CAM在NLP可视化中的应用

深度学习是一个”黑盒”系统,为理解其内部的工作原理,可视化充当重要的角色。可视化往往是深度学习模型的“事后解释”的重要工具。Grad-CAM是很好的可视化方法,本篇介绍一下它在NLP中的应用并提供实现。

阅读全文