Posts List

被deadline驱动的我

 最近一年的我感觉对生活没了追求,就像在海上失去方向的船,不知道该开去哪里。感觉每天都糊里糊涂的,没有了读研以前那种对胜利的渴望,对任何事情都失去了兴趣,每天靠着各种deadline驱动着前进。

我的2019

 2019年似乎没有很努力的学习,所有立下的Flag,不出意外都没有实现。虽然如此,但也并不是完全没有什么收获。在这一年,无论是在学术、生活等方面都取得了一些进展。

数据挖掘比赛总结(10.17)

 从七月份到九月底,主要参加了三个比赛:(1)安泰杯——跨境电商智能算法大赛;(2)全球数据智能大赛——广西水稻预测;(3)IEEE-CIS Fraud Detection。虽然最终的成绩都不是很好,但这几个比赛有值的总结的地方。

随笔(9.14)

 一晃一个假期过去了。原本打算在假期专心写论文,在六月份的时候在天池上看到一个比赛,就想尝试去做一下,就先把论文放一放。一开始,并没有什么思路,用了简单的逻辑回归,发现数据量很大,算法几乎要跑一天,也不能保证输出结果的正确率。

Pandas.DataFrame 数据处理

1. 创建pandas.DataFrame (1) 创建空的df,然后进行填充

TensorFlow学习笔记——Tensor

Tensor  Tensor是TensorFlow对矢量和矩阵的一种高维度的泛化。它与传统编程语言中的数据类型是有区别的,它更像是一种计算中使用的节点,只有在计算(运行)时,才会将数据流入。在TensorFlow中,Tensor使用tf.Tensor来定义,tf.Tensor有两个很重要的属性:数据类型(dtype, 例如 tf.float32、tf.int32或tf.string)和形状(shape,例如shape=(2,2))。

随笔(5.14)

 在博客园看到一篇关于刷Leetcode的文章,然后就浏览了该博主其它文章,发现她也是从2015年开始在博客园上发文章,这不禁让我想起多年前立志要写好博客的自己。

Local Differential Privacy 相关论文

1. LDP相关基础论文 1.1 RAPPOR

Python读写TXT、CSV、XLS文件

1.Python读写TXT文件 1.1 写txt文件: 使用open('output.txt', 'w')以写的方式打开文件(若文件不存在则创建该文件),使用file.write()写入文件,其中参数必须为str字符串。

Apriori算法

 Apriori是一种频繁数据挖掘算法,它在2006年入选由IEEE International Conference on Data Mining所评选的数据挖掘领域的十大经典算法。该算法的主要目的是找出数据集的数据项中频繁出现的项集。

极大似然估计与贝叶斯估计

 通过贝叶斯等方式实现分类器时,需要首先得到先验概率以及类条件概率密度。但在实际的应用中,先验概率与类条件概率密度并不能直接获得,它们都需要通过估计的方式来求得一个近似解。若先验概率的分布形式已知(或可以假设为某个分布),但分布的参数未知,则可以通过极大似然或者贝叶斯来获得对于参数的估计。

非参数估计——Parzen窗方法与k近邻估计

 在做分类问题时,有时候需要使用样本的概率密度函数来求其后验概率。但是很多情况下并不知道其概率密度函数的形式(即样本的分布未知),此时就需要对样本进行非参数估计,来求解其概率密度函数。

支持向量机SVM(一)

 支持向量机(Support Vector Machines SVM)是一种二分类模型,它的目标是在特征空间中寻找对于所有样本距离最大的超平面。与感知机不同的是,在线性可分的情况下,SVM可以得到唯一的解。