CKE

原文地址

http://www.kdd.org/kdd2016/subtopic/view/collaborative-knowledge-base-embedding-for-recommender-systems

该论文发表于16年KDD,主要贡献为在推荐系统中引入了结构信息,文本数据,图像数据等知识库中的信息来提升推荐系统的质量。其中,结构信息采用TransR来得到实体的向量特征,文本数据与图像数据分别使用栈式降噪自编码(Stacked Denoising Auto-encoders, SDAE)与栈式卷积自编码(Stacked Convolutional Auto-encoders)来提取出向量特征。

Item的向量表示是将最初的向量与来自知识库中的三个特征向量相结合。对于构建出的损失函数可以使用随机梯度下降来进行优化,从而实现基于异构数据的ranking推荐。

124上的git-server

124服务器上已经配置好git的server端
可以使用124来进行多台电脑内代码同步以及多开发人员协同工作
git为单独用户,用户名为git

使用方法:
1、生成ssh秘钥
2、使用sudu在/home/git/.ssh/know_hosts中加入自己的ssh公钥(如果顺利可以免密码登陆git用户了)
3、在git用户下建立自己的文件夹
4、在相应文件夹内使用命令 git init –bare 路径/仓库名称.git 初始化仓库
5、在本地git add remote 到124上的仓库

之后操作与使用公网git仓库(github,bitbucket,gitcafe)等一致

不考虑到恶意破坏,没有禁用gitshell,没有进行权限管理

谁的论文最有可能被接受:测量研究机构的影响

原文地址:http://kddcup2016.azurewebsites.net/
Rule地址:http://kddcup2016.azurewebsites.net/Rules

背景:

为了识别出模式或者最大化信息传播,在一个社会网络中寻找有影响力的节点已经成为了一个伴随有实际应用的热门话题。除了明显的广告产业价值之外,研究界一直在寻找一种可以让新的科学发现与技术突破有效传播的机制。从而推进我们集体的知识和人类文明。对于正在为自己的学术追求或者评估申请的学生,家长,以及资助机构来说,拥有一个对于这些研究所的客观评价是非常有必要的。在这样的环境之下,我们已经看到了对于研究机构和大学的排行已经成为了很多杂志报纸以及学术研究所的传统。这样的排名不仅仅吸引了来自于政府,大学,学生和家长的的关注,同时也引发了针对于排名科学行的争辩。对于这些排名最容易被批评的一点是,对于公众来说,所采用的数据以及排名的方法都是不公开的。

2016KDDCup将会通过公开可以得到的数据集来着力于这个问题。比如采用Microsoft Academic Graph(MAG)数据集。这个公开的数据集包含了已经出版的学术文章以及引用的信息。作为一个异构图 ,这个数据集可以用来研究不同类型的有影响力的节点比如:作者,隶属关系以及场馆。我们在这次比赛中重点研究隶属关系。讲真,给定一个研究领域,我们正在尝试把KDDcup社区中的发展的数据挖掘技术联合起来实现基于出版物以及引用情况来确认最好的研究院的这样的一个挑战。

其实就是通过现在给出的数据以及任何在公网上可以获取到的数据,来分别预测一下下面几个会议上论文录取的情况。

Important Dates (2016)

月份 节点
Feb 19th Rules published, data released
March 4th Registration site open
Mar 28th (23:59pm PST) Phase 1 for SIGIR, SSIGMOD, SIGCOMM
Apr 28th (23:59pm PST) Phase 2 for KDD, ICML
May 28th (23:59pm PST) Phase 3 for FSE, MobiCom, MM
Jun 30th Winners Announced
Aug 13th KDD Cup Workshop

Prizes

获奖等级 奖励
1st Place $10,000
2nd Place $6,500
3rd Place $3,500
4th to 10th Travel grants will be available for teams to attend the conference.