卷积核卷积核就是图像处理时,给定输入图像,输入图像中一个小区域中像素加权平均后成为输出图像中的每个对应像素,其中权值由一个函数定义,这个函数称为卷积核。又称滤波器。

什么是lstm,bilstmlstm:是rnn的一种,针对有序的数据,有对数据信息长短记忆的功能bilstm:是前向lstm和后项lstm的组合为什么要lstm, bilstmlstm: 其可以更好的捕获较长距离的依赖关系,通过训练过程可以学到记忆哪些信息和遗忘哪些信息; 举个例子,“我不觉得他好”,“不”字是对“好”的否定,既该句子的情感分析为贬义。bilstm: lstm建模存在一个问题,无法编码从后向前的信息,而bilstm可以;举个例子,“这个餐厅脏的不行,没有隔壁好”,“不行”是修饰“脏”的程度的,只有bilstm模型才能更好的捕获双向语义。lstm原理详细计算过程Bilstm原理

一、BIO 三位标注 (B-begin,I-inside,O-outside)B-X 代表实体X的开头, I-X代表实体的结尾 O代表不属于任何类型的其中,“B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型。二、BMES 四位序列标注法B表示一个词的词首位值,M表示一个词的中间位置,E表示一个词的末尾位置,S表示一个单独的字词。我/S 是/S 广/B 东/M 人/E (符号标注,‘东’是‘广’和‘人’的中间部分,凑成‘广东人’这个实体)我/ 是/ 广东人/ (……

决策树在《统计学习方法》书中对决策树的模型有一个规范的回答。最顶端的是根节点,对样本所有的预测都是从根节点开始依次判断。每个圆形的都是一个用于判断的节点,每一个节点只对属性的其中一个特征进行判断,比如说上文的苹果,圆形节点要么判断颜色,要么判断硬度等等,总之只判断其中的一个特征。在判断节点中只保存告诉你该往哪走的信息,在判断节点中并没有有关结论的信息。矩形节点就是标记节点,在判断中走到矩形就可以认为预测过程结束,将矩形中的标签作为预测结果返回。那么在训练过程中构建这棵决策树的时候需要怎么做呢?就是一个一个特征属性依次比较过去然后建立分支吗?不是的,我们需要挑选最有代表性的特征。比如说苹果的……

K近邻K近邻 - 有监督 - 一种多类划分的模型(K近邻不像感知机只能划分两种类,K近邻是一种多类划分的模型)K近邻算法缺点:1、在预测样本类别时,待预测样本需要与训练集中所有样本计算距离,当训练集数量过高时(例如Mnsit训练集有60000个样本),每预测一个样本都要计算60000个距离,计算代价过高,尤其当测试集数目也较大时(Mnist测试集有10000个)。2、K近邻在高维情况下时(高维在机器学习中并不少见),待预测样本需要与依次与所有样本求距离。向量维度过高时使得欧式距离的计算变得不太迅速了。本文在60000训练集的情况下,将10000个测试集缩减为200个,整个过程仍然需要308……

朴素贝叶斯的直观理解在网上曾经有一个有意思的概率讨论,题目是这样的(我相信所有人都会愿意看一看这种有趣的问题):有三张彩票,一张有奖。你买了一张,老板在自己剩余的两张中刮开了一张,没中。这时候他要用剩下的一张和你换,你换不换?换和不换你中奖的概率一样吗?(你可以思考一下,然后看我下面的回答)—————————————————————————-从直觉上来讲,彩票中奖的概率是1/3,你最先抽了一张,不管咋操作,中奖的概率应该都是1/3。这时候老板排除掉了一张没中奖的,剩下两张必有一张中奖,所以概率是1/2。换和不换应该都一样。你是这么答的吗?这时候需要引申出贝叶斯了,贝叶斯在概率的计算中引入了……

版本及地址结巴分词 Python 版本 地址:https://github.com/fxsjy/jieba结巴分词 Java 版本作者:piaolingxue 地址:https://github.com/huaban/jieba-analysis结巴分词 C++ 版本作者:yanyiwu 地址:https://github.com/yanyiwu/cppjieba结巴分词 Rust 版本作者:messense, MnO2 地址:https://github.com/messense/jieba-rs结巴分词 Node.js 版本作者:yanyiwu 地址:https://github.co……

1. 商务智能的概念商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。商业智能的概念在1996年最早由加特纳集团(Gartner Group)提出,加特纳集团将商业智能定义为:商业智能描述了一系列的概念和方法,通过应用基于事实的支持系统来辅助商业决策的制定。商业智能技术提供使企业迅速分析数据的技术和方法,包括收集、管理和分析数据,将这些数据转化为有用的信息,然后分发到企业各处。2. 支持度、置信度、提升度的概念及其计算方法支持度定义(多个的时候是联合概率):s……

开源工具https://github.com/cosmtrek/air安装go get -u github.com/cosmtrek/air查看go的安装目录 go env针对于 .zshvim ~/.zshrc添加两行# Airalias air="$GOPATH/bin/air"添加好以后 ESC , :wq 保存退出,使命令生效source ~/.zshrc命令行执行一句:which air如果能看到这个,则说明已经可以全局使用了!使用在项目根目录下创建文件.air.conf,并写入以下内容 go build main.go运行air参考https://study……

有这么一个段子,老公看到老婆手机上收到一条短信:“002291 000524 002467 002582”,老公炒股,一看便知是股票代码。有人向她推荐股票?于是查了一下股票名称,才恍然大悟:“星期六 东方宾馆 二六三 好想你!”。如今,每个还在奋斗路上的人都有一个相同的梦想:升值、加薪、出任CEO。于是我突发好奇对4613(2072上证 & 2541深证)家A股上市公司做了一些数据分析。(图片来源于网络)数据获取获取方式:网络采集;统计日期:2022年4月14日。我的姓氏到底有没有聪明的基因?根据上证上市公司2072家中筛取2007名法定代表人有效数据(下图)以及深证上市公司2541家中筛……