Natural Language Processing with Deep Learning
Link summary of Topic: Natural Language Processing with Deep Learning
推荐算法概要
推荐系统算法
Class imbalance in classification
本文是分类算法正负例数量不平衡问题的解决方案。
主成份分析算法 PCA
本文是LDA算法的基本介绍。
LDA Model学习
Spark、Hadoop、Storm对比
Spark streaming和storm、Hadoop与Spark的对比
VRP 与or-tools调研
VRP问题及Google工具or-tools的基础调研。
Java中Math.exp的近似算法
实验过程中发现Java的Math.exp()操作特别耗时间,在坐标下降求解Logistic Regression的过程中Math.exp()几乎用到了70%的时间,因此我们思考是否可以通过近似的方法计算$e^x$的值,文中整理了两种实用的近似计算Math.exp()方法。
Parallel SGD
Parallelizing SGD
- Parallelized Stochastic Gradient Descent
- Hogwild!
- Downpour SGD
SGD 变种
A brief introduction to stochastic gradient descent and its variants.
Downpour SGD(大规模分布式深度网络)
Parallel SGD Paper
Large Scale Distributed Deep Networks
Linux常见文字处理命令
本文主要介绍Linux的常见文字处理命令,如awk, sort, uniq, wc等操作。
字符串全排列
问题:给定字符串S,生成该字符串的全排列。
比如输入为abc,那么输出有以下几种:
即如果输入字符串的长度为N的话,会输出N!个结果。
本文整理了求字符串全排列的若干方法。
二分查找
二分查找算法是在有序数组中用到的较为频繁的一种算法,在未接触二分查找算法时,最通用的一种做法是,对数组进行遍历,跟每个元素进行比较,其时间为O(n).但二分查找算法则更优,因为其查找时间为O(lgn),譬如数组{1, 2, 3, 4, 5, 6, 7, 8, 9},查找元素6,用二分查找的算法执行的话,其顺序为:
- 第一步查找中间元素,即5,由于5<6,则6必然在5之后的数组元素中,那么就在{6, 7, 8, 9}中查找,
- 寻找{6, 7, 8, 9}的中位数,为7,7>6,则6应该在7左边的数组元素中,那么只剩下6,即找到了。
STL总结
STL(Standard Template Library,标准模板库)是惠普实验室开发的一系列软件的统称。它是由Alexander Stepanov、Meng Lee和David R Musser在惠普实验室工作时所开发出来的。现在虽说它主要出现在C++中,但在被引入C++之前该技术就已经存在了很长的一段时间。
组成的库来说提供了更好的代码重用机会。在C++标准中,STL被组织为下面的13个头文件:<algorithm>
、<deque>
、<functional>
、<iterator>
、<vector>
、<list>
、<map>
、<memory>
、<numeric>
、<queue>
、<set>
、<stack>
和<utility>
。
STL可分为容器(containers)、迭代器(iterators)、空间配置器(allocator)、配接器(adapters)、算法(algorithms)、仿函数(functors)六个部分。
本文就是主要介绍STL的基本内容。
Git && SVN 安装
为了利于版本控制与合作,可以选择在自己的机器上搭建Git和SVN的版本控制,本文是在服务器上配置Git服务器与SVN服务器、http访问的简单教程。
Stunnel+Squid访问Facebook
由于访问Google、Facebook、Dropbox等网站的途径被封锁,实验室需要一个能够直连外网的代理Proxy。因此,配置了stunnel+squid的代理。需要一台可以连接外网的VPS和能够连接VPS的实验室服务器。
一阶机器学习优化算法Paper汇总
对一阶机器学习优化算法ADMM、Coordinate Descent和Gradient Descent的paper加以简单整理。