《《数学之美》读书笔记感触.doc》由会员分享,可在线阅读,更多相关《《数学之美》读书笔记感触.doc(14页珍藏版)》请在三一办公上搜索。
1、数学之美读书笔记感触 数学之美读书笔记感触1我在想,为什么我们要学习数学?也许这个问题成年人有一万个答案,可是当我们第一次走进教室,学习数学的时候,大概率还是个孩子,你怎么跟一个孩子解释为什么要学习数学呢?我把这个问题抛给了一个朋友,他说:“为了提高思维逻辑能力,这是我初中老师在第一节数学课上告诉我们的”。或者一位5岁的小朋友又会问:“什么是逻辑能力呢?”也许从出生第一天,我们就一直在被动的接收一些东西,父母的劝导,老师的传授,可5岁的孩子还是会把玩具散落一地,6岁的孩子仍然会因为父母不给买玩具而嗷嗷大哭,无论你怎么劝导一个人,怎么劝诫一个人,他可能仍然会犯你认为会出现的错误。我记得有位教育专
2、家这么说:“你告诉宝宝他把玩具弄坏了,就等于丢了10个棒棒糖”,从此以后这个宝宝可能会更加珍惜玩具。这个方法很简单,但是貌似最有效。数学是什么?数学不就是把复杂的东西简单化么?现在我们再回答前面的问题:为什么我要学习数学?我们可以这么跟5岁的小朋友说:“妈妈给你10元钱,让你买酱油,酱油7元、棒棒糖1元一个,剩下的钱你可以买几个棒棒糖?”或许想吃棒棒糖的就会苦思冥想一番,或许未来妈妈真的给他10元钱去买酱油,结果回来就变成了一瓶酱油和3个棒棒糖。或者再过一段时间,这位小朋友会选择6元的酱油,因为可以获得4个棒棒糖了。他这么计算着:7+3和6+4都可以等于10,那么如果要必须买酱油的情况下,1+
3、9也可以等于10。我们都知道也有1元的袋装酱油,于是9个棒棒糖到手了。任何知识的魅力都在于自我的发现,只有你对它产生了无限的兴趣,你就会不断的发现它的美,数学之美也可以变成物理之美。有些人会说,上面的例子是利益驱动型,不是兴趣驱动型,对于一个孩子来说,你能指望他向成人那样:“我需要的不是物质世界,我需要的是精神世界?”5岁宝宝最喜欢做得事情就是在吃和玩上面,请问,成年人不也是如此么?这就是天性。只不过成年人的自控能力足够大罢了。我们回到书本上,这本书是否合适自己?如果没有专业的数学知识,很难读懂。但是它又有着无限的魅力,让你不自觉的读下去,为什么?因为“数学之美”,虽然大多数人看不懂里面的公式
4、,但是能够明白数学能解决的问题:概率统计学能够解决自然语言处理、布尔代数能解决搜索引擎的问题、有限状态机和动态规划能解决地图问题、向量+特征向量+余弦定理能解决自动新闻分类问题、最大熵模型解决金融问题,看着看着我就莫名的产生了一种想要学习算法的冲动,这不就是本书的意义所在么?数学之美读书笔记感触2在网上看到有人推荐吴军博士的数学之美,尽管我从事社会科学研究,但对数学的推崇一直如此,所以买来一读,我的真切体验正如吴军博士在书的后记中所说,把自己“境界提升了一个层次”。那么,对我而言,到底提升了什么境界呢?首要的肯定是思想境界。在未读这本书之前,我知道对于这个世界的事件形成的信息集合,人类只有两种
5、方式可以表达,一个是数字,一个是语言。整个实数的集合是无穷个,而且每个数字都是唯一的;整个世界中的事件也是无穷个的,而且每个事件也时独一无二的,这样数学中的数字集合与世界中的事件集合就构成一个一一对应的关系,所以研究数字之间的关系,实际上就是在研究世界中事件之间的关系。语言中的概念和世界中的事件之间也是可以构成一个对应关系的,但问题是,语言中概念的集合是有限的,所以它和数字集合的对应显然只能是部分对应。计算机科学的发展,人类需要把语言处理成数字,因为计算机只能识别数字信号,所以“语言的数字化”成为计算机产生以来发展最快、而且最有创新性的领域,而许多华人科学家成为了这个领域的顶尖专家,如李开复,
6、吴军博士是卓越的科学家之一。至此我才感到,在计算机主导的世界中,信息化就是数字化,而最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字化,因为人类的信息几乎100%是用语言承载、传播的,计算机要与人对话,变成智能化的机器,首先要解决的就是语言的数字化问题。但我们在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本没有意识到,那些卓越的语言科学家,早已经把我们的语言,转化成数字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工作。我似乎感到,语言与数字的关系,就是人与自然关系的接口。套用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物的本原,语言是人的本原!吴军博士似乎
7、也在提升我对方法的认识境界。科学研究的思考方式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人类为了让计算机识别语言,采用建立语言规则和语言规则数据库的办法,但最终以失败告终(20世纪5070年代),70年代后科学家采用了语言统计模型,研究取得了突飞猛进。语言统计模型的胜利,再一次证明了宇宙量子模型的信念,世界是不连续的随机性的粒子构成,人类数千年文明进化出来的语言系统,就是动态的随机概率事件。其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻到百分之百确定性的规律,而信息论思维是研究如何把握不确定性现象,利用概率统计是不二法门。其三,语言本质上就是信息传播,只有从通信模型视角才能真
8、正理解计算机的功能,对语言的编码、处理、传输、解码是计算机的强项,计算机是永远不可能理解语言的意思的。在数学之美中,吴军博士对他的老师、师兄弟、同事的经历、掌故进行了叙述,让我们了解到这些世界一流的学科家、技术精英们的为人处世品质、鲜明个性、科学素养及其管理风格。例如贾里尼克对博士生的严酷淘汰,马库斯对学生的宽宏大度,但我感到他们有一样东西是共同的,就是对科学创造、顶尖人才的识别和器重,甚至是无条件的包容。如此为人的境界才是根本,因为伟大的科学创造毕竟是人做出来的,只有崇高的人文精神之下才能造就顶尖的人才、一流的科学和技术。观国内的学说界,官风盛行、人情充斥,与这些一流学说群对科学创造的赏识、
9、对个性人才的包容,对科学探索的热诚,可谓相去甚远。看来,我们只能寄希望于年轻一代,但愿吴博士的数学之美,能让我们的学子们,初步体验到科学精英们卓越的才智与情怀。数学之美读书笔记感触3这本书一共3章,主要介绍了这些数学方法:统计方法、统计语言模型、中文信息处理、隐含马尔科夫模型、布尔代数、图论、网页排名技术、信息论、动态规划、余弦定理、矩阵运算、信息指纹、密码学、搜索技术、数学模型、最大熵模型、拼音输入法、贝叶斯网络、句法分析、维特比算法、各个击破算法等。从第一章开始其明了幽默的语言就深深的吸引了我,让我觉得如果早一点看这本书,也许数学之于我就是另一番天地。第一章里作者从原始人类的通信方式开始入
10、手,人类最早利用声音进行的通信依赖于开篇给出的编码传输解码的基本原理,指出原始人的通信方式和今天的通信方式没什么不同,这世界上近现代最普遍的原理大部分都在人类发展的历史上被无意识的使用着。第六章信息论给出了信息的度量,它是基于概率的,概率越小,其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确定性,同理自然语言处理的大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量,这一点与热力学中的熵概念相同,看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的,要学会借鉴其他知识。这本书里也能找到不少在学的课程知识,如大学专业课里,数电总是要比模电简单不少,而自然界
11、里大部分的信号都属于模拟信号。所谓模拟信号,是指从时间和数值两种维度上看来都是连续变化的信号。在实际电路中,模数转换是一个很重要的过程,将预处理的模拟信号经过模数变换为数字信号,然后进行数字信号处理。而数字化处理有很多优点,比如功能强大、抗干扰能力强、易于传输等。简而言之,如果没有数学,就没有数字信号处理和传输的概念,而数字信号传输在当下大规模的集成电路里是必不可少的,这是通信成功的基本要求。作者把生活中遇到的复杂的问题,以简单清晰,直观的模型或者公式展现出来。我们可能过于注意生活中的种种奇妙现象,往往忽略了追求其理论逻辑的演绎,而这,也是大部分问题的主要根源。罗素曾经说过:数学,如果正确地看
12、,不但拥有真理,而且也具有至高的美;爱因斯坦也曾说过:纯数学使我们能够发现概念和联系这些概念的规律,这些概念和规律给了我们理解自然现象的钥匙。数学在所有科学领域起着基础和根本的作用。哪里有数,哪里就有美。在这里,我也想把数学之美真诚推荐给每一位对自然、科学、生活有兴趣有热情的朋友,不管你是从事职业,读一读它,会让你受益良多。吴军老师在数学之美中提到:这本书的目的是讲道而不是讲术。很多具体的搜索技术很快会从独门绝技到普及,再到落伍,追求术的人一辈子工作很辛苦。只有掌握了搜索的本质和精髓才能永远游刃有余。回到我们日常的生活中,需要学习的东西、技术太多太多,如果一味地只为去追技术的脚步,那么我们也会
13、很累很累。然而基本的原理却是没有怎么变化的。只见森林,不见树木,难免迷失;站在高处向下看,也许我们一直看不到底,但是站在底处却是可以看见底的。数学之美读书笔记感触4数学之美,一个从事多年工作的谷歌研究员眼中的数学。令我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机行业中。在语音识别、翻译,还有密码学领域,有着许多基于概率统计的模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,神经网络模型。在搜索中,一些相关性的计算,无不用到了概率的知识。在新闻分类中,用到了一些有关矩阵特征值、相似对角化的知识。当然,在图像处理方面,矩阵变换可谓是无处不在。另外,在识别方面,有一些通信模
14、型,涉及到了信道、误码率、信息熵。最近刚开学也没什么事,所以就想随便找几本书看一下,但最好别是那种太艰深晦涩的书。8月份一直到现在,吴军写的这本12年5月出版的数学之美一直盘踞京东、亚马逊等各大网上商城科技类图书的榜首,当然,还有早些时候出版的浪潮之巅也排在很靠前的位置。心想市场的力量应该能帮我挑出好书吧,于是就从图书馆借了一本来,一直到今天晚上把它给看完了。因此想写一点东西来总结、反思一下,反正刚开完班会也没什么事干。写在前面的建议:如果你不讨厌数学的话,强烈推荐这本书,网上也可以下到电子版,不过阅读感觉上还是很不一样的。废话就不多说了,数学之美其实是一本科普类的读物,所面向的是接受过普通高
15、等教育的人,完全不需要在特定领域有很深的造诣就可以看懂,大概懂一点线性代数、概率统计、组合数学、信息论、计算机算法、模式识别最好(虽然列举了这么多,其实有些不懂也没关系),所以尤其适合信科的人看。内容大部分是和人工智能、计算机相关的,这并非我所学的专业,但作者比较擅长将看似复杂的原理用简明的语言表达出来,所以可读性还是很好的。吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,这些*都是发表在Google黑板报上的,后来经过了重写,所以网上下载的和书本内容有所差异。由于吴军本人是研究自然语言处理和语音识别的,所以统计语言模型的东西可能会多一点,不过我觉得这丝毫不妨碍全书数学之美的展现感
16、觉收获还是挺多的,知识上的有一些,但更多还是思维方式上的。作者举了很多例子试图让人明白很多看似复杂的高科技背后,基本原理其实是出乎意料简单的(当然,必须承认第一个想到这些方法的人还是非常了不起的)。比如高准确率的机器翻译,看上去好像是计算机能够理解各国语言,隐藏在背后的却是很多具有大学理科学历的人都非常清楚的统计模型和概率模型;再比如拼音输入法的数学原理,早期的研究主要集中在缩短平均编码长度,比如曾经流行一时的五笔输入法,而现今真正实用的输入法却是有很多信息冗余、编码长度比较长的拼音输入法,作者从信息论和市场的角度做了简单的阐述;又比如新闻的自动分类,许多非IT领域的人可能会认为计算机可以读懂
17、新闻并进行分类,而实际上只是特征向量的抽取、多维空间中向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对是一看就懂的当然,完美的实现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不是繁琐。除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和中国学生的成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于中国高等教育以及很多中国企业的批评,一是教育的功利性,缺乏宽松的独立思考的环境,即使学了一堆理论也难有用武之地,自然也就缺乏创新性的成果;二是中国企业的短视,大部分都不舍得在新框架开发上投资,而
18、是坐享学术界和国外企业的研究成果。总结一下呢,数学之美事实上不能带给你编程能力的提升,也没法让人的数学水平有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的“枯燥”的数学真的可以“四两拨千斤”,改变亿万人的生活。数学之美读书笔记感触5第8章里的“索引”,作者讲到谷歌面试产品经理的一道题目:如何向你的奶奶解释搜索引擎。关于这个问题,好的回答据说是用图书馆的索引卡片做类比。我奶奶是个文盲,一生为农,日出而作,日落而息。她很少看电视,更别说图书馆。所以
19、用图书馆的例子,对我们来说,很生动;对她来说,很生涩。我们村的田地是按照地形、土质和流水等来划分的,计有一等地、二等地和三等地。一般情况下,一等地用来种水稻,二等地用来种菜,三等地用来种水果。所以当我奶奶想要给我摘桔子的时候,她肯定不会从一等地或者二等地一块地一块地找过来,而是直接跑到三等地(一般就是山上)。像这样的索引,是基于脑子里的“数据库”,因为田地不会很多,多了也来不及种,所以跟布尔代数没什么关系。但是这样解释,我奶奶就会大概明白了。我奶奶生前一次电脑也没用过,跟她解释这些,唯一的意义是,她会觉得我没有敷衍她,这会使她欣慰如果有机会解释的话。杨小凯曾经说,如果张五常多加注重使用数学模型
20、,那诺奖也许就拿下了。张五常对此不以为然,反以为傲,自诩当今世上只有科斯、阿尔钦和他才敢只用文字,不借助数学模型就在经济学界占有一席之地。当然,张五常也不是彻底否定数学的作用,他认为能够用文字解释的经济学原理,不必使用数学对其复杂化。数学在信息学和经济学里都有广泛应用,但是在信息科学方面,对数学作用大小的争论就没有经济学那么大了。我们常说搜索引擎的竞价广告,就可能经历到第三方公司,通常他们宣传自己是谷歌或者别的搜索引擎公司的代理商,然后通过不正当手段为客户提高网页的排名。谷歌在消除网络作弊方面做了很多努力,通过修改排序算法来为搜索者提供更加准确实效的信息。“作弊的本质是在网页排名信号中加入噪音
21、,因此反作弊的关键是去噪音。沿着这个思路可以从根本上提高搜索算法抗作弊的能力。”我们公司就是吃了这个亏,交了不少钱给第三方公司,结果算法一变,关键词的排名从前三下降到前三页没影。社交搜索正在雄起,但是如果想要在传统的搜索引擎中占据有利排名,我想,第三方公司的技术水平是很关键的。大学专业课里,数电总是要比模电简单不少。自然界里大部分的信号都属于模拟信号。所谓模拟信号,是指时间和数值上都是连续变化的信号。在实际电路中,模/数转换是一个很重要的过程,将预处理的模拟信号经过模/数变换为数字信号,然后进行数字信号处理。而数字化处理有很多优点,比如功能强大、抗干扰能力强、易集成化等。简而言之,如果没有数学,就没有数字信号处理的概念,也就无法进行信号的传输,而数字信号传输在大规模的集成电路里是必不可少的,这是通信成功的基本要求。之前看到有人说如果高中看这本书,也许数学就是另一番天地,会有所突破。我不觉得,如果高中看这种书,我想,大多数人还是会对数学更加望而却步。本书更适合通信电子这些专业的学生,在学习专业课的时候辅助阅读,对理解通信原理、数电模电等都有更形象生动的想法。