机器学习笔记第四周+知识图谱
多功能:
由于单一量预测不太准确,所以引入多向量,比如这个房子预测,现在有四个元素,就构造一个四维矩阵,表示法是:
某个向量;
某个向量的第几个个元素。
随之而来写法上又升级了,变成可以写多个向量,然后在表达的时候,可以很方便的用向量表达,但是我不是很熟悉数学上的转置,所以我没非常熟练。
涉及到代价函数的时候,由于向量存在,所以表达方式可以优化到和原来一样
比较单一元素与多元素,发现是完全类似的,代价函数算法完全一致,就是多个单一元素的合体
特征缩放:
说一下问题:一旦取值相差很大,一个是范围巨大,一个范围很小,那么就会导致图形异常肥大扁扁的,或者是很尖锐,很细长,在机器学习的时候,寻找最小值的时候都要因此增加很多个反复横跳的过程
简单地缩放,可以得到更加好的线条,利于寻找最小点,把路径通过人为努力减小了。
关于缩放范围,在±3是合理的
规则:数值尽量控制在一个正负区间,所以值变化
然后u一般是平均值,然后s一般是最大最小差值,或者标准差也可以(虽然我没理解为什么标准差可以)
学习率:
正常情况下:竖轴代表学习离最小值距离,横轴代表学习次数,主要讨论学习力
收敛速度快慢导致的问题
知识图谱定义:
规范数据关联网络
大数据视角,对于搜索引擎
知识图谱搜索引擎运用:
比如问G20峰会什么时候:
1:跳出很多条链接很容易,这是搜索引擎的算法
2:但是跳出一个明确的回答几月几号就很难,因为这个除了人工事先写入,是需要机器自己做判断的,所以是存在技术难度的,这个就需要知识图谱,形成关系网络
个性推荐:
通过个人关系,机器理解人的偏好
额,听了1小时知识图谱,大部分都是商业运用,感觉有点机器学习小儿子的感觉,下一周就进入知识图谱的关系型数据库学习啦