Abstract 这篇文章是我见到的发表在AAAI上的一篇短论文,本文提出了一种可以生成关于跨领域问题的可解释推荐规则.本文的贡献是:使用关系生成规则,这些规则能够解释为什么把商品推荐给特定用户. 2. 使用用户在不同领域 去看看~
《深度学习在美团推荐平台排序中的运用》知识点整理
深度学习在美团推荐平台排序中的运用这篇文章写得非常好,但是对于小白的我来说有一些知识点不是那么容易啃,所以在此特意做一个整理,防止自己以后会忘记…本文是对《深度学习在美团推荐平台排序中的运用》的二次加 去看看~
A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems(2015)
Abstract 在这项工作中,本文提出了一个基于内容的推荐系统,以解决推荐质量和系统可扩展性.根据用户的浏览历史记录和搜索查询,文章提出了一些能够完美刻画用户的特征表示.本文使用深度学习方法将用户和项目映射到潜 去看看~
Learning to Rank using Gradient Descent
Abstract 本文提出了 RankNet, 引出pairwise排序方法梯度下降法来学习排序. 我们使用神经网络来实现这个 idea本文使用 toy data来测试结果.这是第一篇关于 AUC 优化 pairwise 方法的论文, 虽然已经过去了几年,但是对 去看看~
One The Direct Maximization of Quadratic Weighted Kappa
Preliminaries Quadratic Weighted Kappa最初的原则是用来做评分者信度,评分者信度主要用于小样本检验中, 用于两个评分者对同一批测试者进行测试获得两组检验结果,检测这两组检测结果是否可信, 被广泛用于离散 整数 去看看~
优化方法上机作业
编写程序求解下述问题
How to win a data science competition
Course goals Week 1 Intro to competitions & RecapFeature preprocessing & extraction Week 2 EDAValidationData leaks(what to, how to, how to find it, data leaks exploration) Week 3 MetricsMean-e 去看看~
RNN & Attention
RNN Conditional Generation 去看看~
Leveraging Long and Short-term Information in Content-aware Movie Recommendation
Introduction 论文动机:RNN 可以捕捉用户短期的兴趣偏好变化,矩阵分解推荐方法基于用户的长期兴趣进行电影预测,其长期变化相对于时间变化非常缓慢.此外,大多数现有的推荐系统在进行推荐时只考虑用户过去的行为。与 去看看~
GAN
We will control what to generate latter -> Conditional Generation
3.2 偏差-方差分析
这章节回答了"为什么训练 loss 相同的两个模型,预测能力却完全不同"的问题. 到目前为止,在我们对回归线性模型的讨论中,我们假设基函数的形式和数量都是固定的.正如我们在第1章中所看到的,如果使用有限大小的数据 去看看~
对角化矩阵与马尔科夫链的应用
一个方阵 A 是diagonalizable 当 A=PDP−1
其中 D是对角矩阵, P 是可逆矩阵
不是所有 matrix 是可以被对角化的 例如:
3.1 线性回归模型
从概率论的角度看我们的目标是预测分布p(t∣x),这表达了我们对 x 的每个值对样本预测值 t 的不确定性.从这个条件分布中,我们可以对x的任何新值进行t的预测,以便最小化损失函数的期望值。尽管线性模型作为模式识别的实用技术具有显着的局限性,特别是涉及高维度输入空间的问题,但它们具有良好的分析研究的性质,并为后面章节中讨论的更复杂模型奠定了基础。
1.6 信息论
我们首先考虑离散随机变量 x 当我们观察到该变量的值时候,我们可以将信息量视为x 值的"惊喜程度". 如果我们被告知刚刚发生了一个非常不可能的事件,我们将收到的信息比我们被告知刚刚发生了一些非常可能发生的事件的情况要多,如果我们知道该事件肯定会发生,我们将不会收到任何信息.因此,我们对信息内容的测量将取决于概率p(x), 因此我们要寻找一个函数h(x),它是p(x)的单调函数,表示信息内容.h(⋅)形式可以是:如果我们有两个不相关的事件 x 和 y,那么两者的信息应该是分别获得信息的总和,即
1.5 决策理论
我们在1.2节中看到概率论如何为我们提供量化和操纵不确定性的一致数学框架,在这节,我们转向对决策问题的讨论,当决策问题与概率论结合时,我们能够在涉及不确定性的情况下做出最优决策,例如在模式识别中遇到的那些问题。
假设我们有一个输入向量x和属于向量的标签t,我们的目标是预测给定未知量 x 情况下,给出预测的标签t。对于回归问题,t将包括连续变量;而对于分类问题,t将表示类别标签。联合概率分布p(x,t)为不确定下的参数估计提供一种可行的方法。从训练数据中确定p(x,t)是一个inference的例子,这通常是一个非常困难的问题,其解决方案构成了本书大部分内容的主题。然而,在实际应用中,我们必须经常对t的值进行具体的预测,或者更一般地根据我们不同预测的值采取不同的行动,这个方面是决策问题的主题.例如,考虑一个医疗诊断问题,我们已经拍摄了患者的X射线图像,我们希望确定患者是否患有癌症.在这种情况下,输入向量x是图像中像素的集合,输出变量t将表示癌症的存在,我们用C1类表示,或者没有癌症,我们用C2类表示有癌症.我们可以选择t为二进制变量,使得t=0对应于C1类,t=1对应于C2类.稍后我们将看到,标签值的类型对于概率模型的选择来说特别方便.那么推理问题涉及确定联合分布,这里给出完整的概率概率描述p(x,Ck)(或者写p(x,t)).这是决策步骤,决策问题告诉我们如何在适当的概率下做出最优决策.我们将看到,一旦我们解决了推理问题,决策阶段通常非常简单.如下介绍决策问题的部分思想:
在进行更详细的分析之前,让我们首先考虑期望概率如何在决策中发挥作用.当我们为新患者获得X射线图像x后,我们的目标是决定分配一个标签给新图像.我们需要的是新患者 x 在两个类的概率,他们由条件概率p(Ck∣x)确定.基于贝叶斯定理,这些概率可以表述为:
1.4 维度灾难
虽然维数的诅咒肯定会引起模式识别应用的一系列重要问题,但它并不妨碍我们找到适用于高维空间的有效技术,原因有两个:
1.2 概率论
1.1 例子:多项式拟合中贝叶斯公式:结合观察数据提供的信息,将先验概率转化为后验概率
以多项式拟合为例:
Sqoop的学习笔记
压缩: sqoop命令中带上-z或者–compress,即可对拉取的数据进行压缩。 默认压缩算法为gzip,导出后在hdfs中的数据,后缀默认为.gz sqoop import \ --connect jdbc:mysql://localhost:3306/horus \ --username root - 去看看~