(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201711308050.6 (22)申请日 2017.12.11 (71)申请人 北京航空航天大学 地址 100191 北京市海淀区学院路37号 申请人 深圳北航新兴产业技术研究院 (72)发明人 蒲菊华 陈虞君 刘伟 班崟峰 杜佳鸿 熊璋 (74)专利代理机构 北京永创新实专利事务所 11121 代理人 冀学军 (51)Int.Cl. G06F 17/3 0 (2006.01) G06N 3/ 04 (2006.01) G06N 3/ 08 (2006.01) G06Q 50/0 0 (2012.01) (54)发明名称 一种参数化的论文网络节点表示学习方法 (57)摘要 本发明公开了一种参数化的论文网络节点表示学习方法,该方法首先构建一个空的论文节点队列,然后采用随机游走方式采样任意一个论文节点的邻居节点、及邻居的邻居节点;并将选取的论文节点作为论文节点队列的第一个元素,随后依据跳转概率得到论文节点队列的其他元素;遍历完成所有的论文节点,则有论文节点队列集合;然后采用正负采样方法生成多层感知机的神经网络训练数据;最后采用神经网络论文概率模型进行处理,得到论文节点语义信息到论文节点向量表示的非线性变换,进而得到论文节点的向量表示。 权利要求书4页 说明书14页 附图3页 CN 108228728 A 2018.06.29 CN 108228728 A 1.一种参数化的论文网络节点表示学习方法,其特征在于包括有下列步骤: 步骤一,基于随机游走方法采样获取任意一个论文节点的邻居—论文节点集、及邻居的邻居—论文节点集; 步骤101:构建一个论文节点空队列,记为V,所述V用来存储论文节点序列;论文节点空队列V的最大队列元素位数为mv,mv的取值为10~20;然后执行步骤102; 步骤102:选取任意一个论文节点papera,然后将所述papera放入论文节点队列V中第1 位;然后执行步骤103; 步骤103:获取属于任意一个论文节点papera的全部邻居论文节点集,记为 邻居论文节点是指与任意一个论 文节点papera之间存在连边的论文节点集合;然后执行步骤104;步骤104:根据所述邻居论文节点集 中邻居节点总数B确定跳转到第一 跳转概率 c表示跳数;然后执行步骤105; 步骤105:采用别名采样算法(alias sampling) ,根据当前的 在所述中获取下一跳的邻居论文节点 同时将 放入论文节点队列V的第2位;然后执行步骤106; 步骤106:获取属于邻居论文节点 的全部邻居论文节点集,即邻居的邻居—论文节点集 然后执行步骤107; 步骤107:计算邻居论文节点 与任意一个论文节点papera之间的最短跳数 然后执行步骤108; 其中 代表的是从任意一个邻居论文节点到前一个论文节点的最少跳数距离; 步骤108:根据所述的 来确定 跳转到第二跳转概率 然后执行步骤109; 所述第二跳转概率 c表示跳数。 步骤109:经 确定之后,根据 和别名采样,选择 作为下一跳论文节 点,同时将 放入论文节点队列V中的第3位;然后执行步骤110; 步骤110:循环执行步骤106和步骤109,直至论文节点队列V中的位数为mv时,本次随机游走停止;然后执行步骤111; 权 利 要 求 书 1/4 页 CN 108228728 A 2 步骤111:对于整个论文网络中的每一个论文节点重复执行步骤101到步骤109,来完成论文节点的邻居节点采样,则有论