《programming collective intelligence读书笔记六》的相关内容
相关博客
programming collective intelligence读书笔记六
第七章:decision tree讲的是一个大网站,推出了一个新的服务,免费体验,高级功能收费,怎样鉴别众多用户中潜在的肯花钱的那些出份问卷是个麻烦用户的办法...这里讲的是怎么分析他们网站上的行为来得到结论一个用户会有referrer(从哪来) location(地区) read FAQ(y/n) Page viewed(number) Service chosen(none/basic/pre ...
by chenjinlai 2008-05-09 浏览 (130) 回复 (0) 关键字:
(转贴)数学之美 系列十六 (下)- 不要把所有的鸡蛋放在一个篮子里 最大熵模型
2006年11月16日 上午 06:50:00发表者:Google 研究员,吴军 我们上次谈到用最大熵模型可以将各种信息综合在一起。我们留下一个问题没有回答,就是如何构造最大熵模型。我们已经所有的最大熵模型都是指数函数的形式,现在只需要确定指数函数的参数就可以了,这个过程称为模型的训练。最原始的最大熵模型的训练方法是一种称为通用迭代算法 GIS(generalized iterative scal ...
by wangdei 2008-05-13 浏览 (84) 回复 (0) 关键字:
信息论在信息处理中的应用
数学之美 系列七 -- 信息论在信息处理中的应用2006年5月25日 上午 07:56:00发表者:吴军, Google 研究员 我们已经介绍了信息熵,它是信息论的基础,我们这次谈谈信息论在自然语言处理中的应用。先看看信息熵和语言模型的关系。我们在系列一中谈到语言模型时,没有讲如何定量地衡量一个语言模型的好坏,当然,读者会很自然地想到,既然语言模型能减少语音识别和机器翻译的错误,那么就拿一个语音识 ...
by 晨星★~雨泪 2008-03-03 浏览 (130) 回复 (0) 关键字:
相关新闻
四个有害的java习惯
John O'Hanley 的这篇文章列举了四个有害的java编码习惯,并提出了改正方案。
这四个习惯普遍存在于java程序员中,并且已经被广泛接受,大家都习以为常,流毒甚远。
1.对局部变量(local variables),字段(fields),参数(method arguments)这三种变量的命名没有区分,造成了代码的阅读困难,增加了代码的维护成本。
...
by jolestar 2008-07-29 浏览 (6751) 回复 (56) 关键字:

