存档

‘学术研究’ 分类的存档

必应词典新应用改进建议

2013年5月3日 4 条评论

---

首先感谢编程之美全国挑战赛在之前的活动中给予的最佳博客奖,这里对必应词典新出的两个应用(必应电台&单词挑战)的使用体验简单描述下:

必应电台

1. 个人建议“听写”这个功能可以砍掉了,有点凑功能的嫌隙。首先,在如此快的播放速度下,用键盘跟着语速敲出来难度太大,仔细考虑下,这个功能的实用性真心不大;其次,已经提供了原文参考,这跟提交对比没啥区别;再者“返回听写”这个按钮也是冗余的,其功能也就是上面的播放开关的“开”的功能。

2. 除了CRI的内容,可否有更多一些收听选择?

3. 点击了左侧的收听列表,电台就自动从节目单的第一条开始播放,个人觉得没必要;要播放哪个,用户自己来选择就好,省的用户还没反应过来,已经播放一大块了,即使要收听最新的内容也还是要重新点击从头播放。

4.关于推广,我搜索了CRI每日新闻,发现有下载CRI音频的需求,但是他们未必知道bing的这个应用,其实bing很多东西做的挺好的,就是感觉缺少一些推广,个人感觉必应词典客户端界面下面的广告较烦人,倒不如换成“体验必应英文电台,下载CRI音频”这样类似的文字,为自己的应用产品做一些推广,而不是做其他的广告。

阅读全文...

网页版必应词典功能改进建议

2013年4月4日 没有评论

---

一直用的是旧版的必应词典,用起来很顺手,对于新版必应词典的建议,个人觉得在用户体验上更多地应该借鉴一下旧版的思路,有选择性保留一些功能亮点,下面说一下相对于新版词典,我选择用旧版的几个理由,或者说旧版让我用起来比较爽的地方:

建议 1)新版应该借鉴旧版的单词对比功能,如图所示,旧版通过标签的拖拽可以实现同义词的对比,一目了然;而新版的同义词无法实现对比,且加载速度感觉稍微逊色于旧版。

建议 2)之所以喜欢旧版,是因为这个产品的细节做的非常好,有一个细节个人很喜欢,就是旧版词典的“查询框”默认是全选待编辑的,如图所示,默认是全选待编辑状态,大大地方便了下一次的查询,可以直接输入新的查询词,而不需要先手动删除历史查询词,再输入新的查询词。对新版的建议就是对此加以借鉴。

建议 3)还有一个细节,建议新版词典引入,就是对于每次查询,旧版都会提供纠错的机会,如果单词的释义有误或用户觉得有更好的释义,尤其是对于句子的翻译,为用户提供发表建议的机会就显得很用心,如图所示是旧版的功能,新版没有,望借鉴

建议 4)建议新版保留旧版的历史查询词功能,这点个人觉得很好。

建议 5)建议有插件可以让词典嵌入到各个浏览器工具栏中,每次就不用找了,直接查询。

阅读全文...

TF-IDF来源及理论推导

2012年8月16日 7 条评论

---

了解文本挖掘的都知道TF-IDF这个概念,以前也做过一个文本分类的项目,用到TF-IDF,当时也就是照现成的公式用,也没想过它的公式为什么那么定义,只是有一个感观上的理解。

了解信息论的都知道“熵”这个概念,这是个了不得的成就,信息是个很抽象的概念,但信息熵的提出很好地解决了信息的量化问题。

信息熵的用处很多,一个典型的例子就是它在决策树算法中的应用了,我最初接触信息熵和决策树时整理了一点资料(入门看),在这里备份,方便以后查找。

  1. 20090701-Yx.Ac-信息熵
  2. 20090714-Yx.Ac-决策树ID3
  3. 20090714-ID3条件熵的选择推导证明

郁闷的是我现在才知道TF-IDF的定义原来是由信息熵推导而来的,信息熵真是不错,要知道TF-IDF的各种形式常被搜索引擎所应用,它已经深深影响并改变着人们的生活。TF-IDF用在向量空间模型中为文档向量进行权重赋值,那么使用TF-IDF计算的权重有何物理意义呢

阅读全文...

推荐一个不错的学术研究视频网站

2012年2月26日 没有评论

---

推荐一个不错的学术研究视频网站:http://videolectures.net/

网站是关于各个领域研究方向的报告视频及slides,其中不乏很多数据挖掘、机器学习方面的讲解视频,slides可以下载。可以作为回顾知识和入门新方向的一个不错的选择。

刚才看了一个关于spectral clustering(我的研究方向)的介绍,08年的报告,presenter在最后提出可研究的问题都是最近09-11年顶级会议文章的侧重点,例如spectral clustering与Semisupervised Learning的结合,spectral clustering与Active Learning的结合等。悔呀,看见太晚了,哈哈,不过以后碰到数据挖掘和机器学习方面的东西可以到这上面查一查了。

阅读全文...