signed

QiShunwang

“诚信为本、客户至上”

数学论文(优化方向)写作总结

2021/4/26 13:49:06   来源:

宗旨:

数学论文读者主要是数学同行或者数学基础良好的工程师,所以一定要在逻辑严谨上猛下功夫。数学工作者对任何事实和现象都倾向于给予一个严格的证明过程,从而将其转化为定理。所以,对于阅读数学论文或者撰写数学论文,这种思维习惯也会被带过来。一篇好的数学论文的文字应该是跟严格证明过程相通的,以少数的行业背景为前提,通过一个逻辑路线引出文章各个部分。整篇文章所有文字可以看做一个“大的证明过程”。

摘要:

主要对本篇论文的工作进行“预告”,框架比较固定。1:本篇论文的大背景是什么?2:具体研究了大背景中的哪个子问题?3:是通过什么技术来做的?4:得到了什么样的结果?包括理论结果,数值仿真结果。当然,如果采用开门见山的写法,则有时候第1部分大背景都可以省略不写。

引言:

假设读者对你摘要预告的内容感兴趣,他们会进一步去看你的引言。所以引言实际是摘要的某种扩展。框架也比较固定。1:跟本篇论文相关的经典问题是哪一个?阐述经典问题近些年获得了哪些应用,借此来辅证该经典问题是重要的问题。2:经典问题当前已经有哪些进展,都有哪些方法研究它?3:引出自己所做的工作。A:说明所研究的子问题与经典问题有什么关联?(等价性理论)借此来辅证子问题研究的意义。B:目前的方法和理论中都有哪些优点和不足? C: 你的方法是否可以充分应对这些不足? D:你具体引入的技术和获得结果“预告” E: 符号记号说明 F: 章节安排“预告”

论文主体:

A. 问题建模 (知识预备)

说明原问题的形式,然后你是如何一步一步进行转化得到自己的问题的。要用理论的手段说清楚每一个细节。服务于通篇论文的大定义,大引理,通常都是教科书级别的,可以放到本章节,当然这也要看是否有对文章紧凑写法和理解带来实质性帮助。

B. 转化问题理论体系

添加转化问题跟原问题的理论联系(等价性证明),以及转化问题相关的一些理论分析。定义,命题,引理,定理,推论之间要有合适的语言过渡和描述,使得别人仅仅借助语言描述就可以充分了解这部分的理论结果。

C. 算法及算法理论

给出算法伪代码框架,并且给出收敛性和收敛速度分析。解释清楚伪代码每一行的功能和整体的收敛去向。如果自己算法的终极版本属于启发式的,直接给出太突兀,也不好的做理论分析。那就先给出几个过渡版本,然后给过渡版本充分的理论分析,最后给出终极版本。

D. 数值实验

1:先弄清楚目前跟所研究的问题的经典算法有哪些?将其作为比较对象。2:人家都对比了哪些指标,并且搞清楚每个指标的含义,然后根据自己的特殊情形来决定是否要比较所有指标,是否需要再添加新的观测指标(主要为了辅证自己理论体系中特殊定理的正确性),是否可以舍去跟自己特殊情形中不太相关的指标?3:先搞定随机实验(数学是根据某种原理构造的,且伴有一定的随机性)。随机数据的生成方式有哪几种,背后的意义是什么?随机生成方式是否足够多样化。极端情形考虑:如果压根找不到真实数据。通过你的随机仿真数值实验,能不能让别人信服你算法的可靠性?4:在随机实验完成的基础上,再去搜索一些大家都做过的真实数据,以此来充分辅证算法的可靠性。

论文结论:

结论内容其实跟摘要和引言有部分意思差不多,但是是假设读者已经充分了解了你本篇文章的各个部分的前提下所做了总结和概况。鉴于这样的考虑,结论部分可以引入论文主体部分的信息而不会让人感觉莫名其妙。它不是论文“预告”,而是论文“观后感”,或者是电影高水平“影评”,是作者模仿读者的视角写的“观后感”。要对论文研究了什么问题,用了什么方法,获得了什么样的结果,包括理论结果和数值结果做一个深刻的总结。当然跟所有“影评”一样,你会忍不住“预告”论文的“续集”的彩蛋,实际上就是研究展望。

致谢:

感谢对论文有帮助的国家自然基金或者省基金(资金支持)。感谢匿名审稿人的悉心指导和建设性建议。感谢导师的辛苦指导,感谢相关老师的帮助,感谢实验室同门的帮助。

参考文献:

非必要,不参考。原则上只参考著名期刊上的文章,著名学者的文章,顶会论文,以及著名专著。

论文篇幅控制的“两招”:

作为初学者,我们的论文要首先要做到“精炼”。大牛们都时间非常宝贵,所以没有时间听你“瞎扯”。当大牛们审稿时,他们会直接看你做了什么问题,得到什么理论结果,数值实验效果如何?然后看看你的Introduction的动机是否“正确”,因为人家自己有一整套研究体系,你的问题在他们的框架中扮演什么角色他们都门清。Introduction的动机可能主要两种作用,当他们感觉你的问题很有意思时,想看看你的动机是什么;另外一种是想看看你的动机是否“正确”,优化入门了没有。

基于这样的观查。我建议初学者把长文控制在20页以内,短文控制在10页以内,以简略风为主。如果你的论文结论非常重要,只需要展现实质性内容,那么可以直接用简略风撰写,写出来几页就几页,牛逼的理论论文3页就可以,例如Nestrov加速。但如果你需要给文章调整篇幅,现在介绍两种常用的招。

短文长写:如果你的论文实质性内容有10页,而且这些结论不是非常硬的货,你想扩充为15页。那么哪些地方可以添东西而不会引起反感呢?我们可以给所做问题添加一些背景式介绍,你可以想象你的这类论文的读者一般都是优化初学者,大佬对这种结果兴趣都不大。所以,你可以通过更加丰富的背景介绍,让别人学到知识的同时,还可以对整个大背景有所了解。另外,我们还可以添加更加丰富的数值实验来辅证结论的可靠性。

**长文短写:**如果你的论文的实质性内容已经达到20页或者超过20页,那么你可能要考虑删减了。如果不想删减,至少要保证内容足够简洁。可以删减的情况通常是内容本来有冗余,前期写得并不好。删减不动的情况主要是内容确实多,而且很重要,没关系,优化中也有接收长文的顶刊。此时,我们的写法就是中学里的“开门见山”式的写法,大背景都不写,直接写自己做了什么,得到什么理论结果,数值仿真效果如何。Introduction中把自己动机很精简得刻画出来,当然可以达到这种情况的文章一定非常优秀,而且你的动机跟大佬看完你的摘要大致猜到的动机基本吻合。

评注:

自己怎么写论文其实也就确定了自己所喜爱的文风,也决定了自己看论文的顺利和侧重点。

我们看一篇优化问题,首先看到题目是否跟自己的课题非常相关,或者跟自己极度想要了解的新课题是否非常相关。然后,我们再看看作者是不是大佬。如果不是,我们也要看看论文作者是不是最近发表了一系列该方向的好工作,发表在重要期刊上,那么这就是一个值得关注的新团队。接着,我们再看一下文章发表的期刊是否顶刊或者好期刊,这往往决定了文章的质量,因为至少本期刊的审稿人认可了这篇文章。紧接着,我们还要看看发表时间,对于潮流问题,我们需要时间比较新的,即最近3~5年最佳;对于经典的,非常重要的问题,那些里程碑式地工作,我们忽略其发表年限,因为这些论文永远不会过时。

通过前期判断,我们确定要读这篇文章后。如果时间很紧,我们又想比较好地了解这篇论文的结果,怎么办?我们可以学习大佬看文章的方式。摘要是必须要看的,看他们做了什么问题,用了什么方法,得到什么理论结果。(最后一句实验仿真验证肯定都说是好的,所以摘要最后一句通常是信息最少的废话);这也相当于看电影时的“预告片”。接着Introduction要认真读完的,搞清楚一个问题研究的大背景或者小背景,以及作者研究的动机。再看看章节安排,就跟书的目录一样。这也有点像“电影简介”,描写大致故事情节。然后,我们可以以“快进”的方式,浏览一下有哪些理论结果,算法框架是怎么样的(最重要的迭代步要搞清楚怎么算的),数值实验都做了哪些实验,用了哪些数据或者什么类型的数据,用了哪些指标,对比了哪些算法,直接看实验图和别人的实验结论,然后自己评定该算法真正的性能。

等所有看完后,还要有一个“电影的观后感”,当然这是作者站在读者的角度模拟写出的观后感,也就是文章的结论。通过文章结论再帮我们快速回顾文章最主要的理论结果和数值实验结论,最后跟着作者的角度看一下文章“续集”的“预告片”,也就是研究展望。

通过以上这种方式,我们不仅学到了这篇文章的知识,而且还可以学习一下人家写文章的篇章布局和遣词造句。那么我们以这种快速浏览的方式看论文时,我们真正跳过的内容是什么?你估计也猜到了,就是繁琐的证明细节,繁琐的算法超参数设置细节,以及数值实验结果的分析细节等等。忽略这些细节不会妨碍大佬们对文章主要信息的抓取。

数学论文撰写是和阅读时"难点":

快速阅读数学论文时,我们通常只看结论不看证明。我们也要注意到一个有趣得事实,应用数学家跟基础数学家不同。基础数学家的工作就是写证明和发表证明,应用数学家则需要写证明,写代码,调试程序,搞项目(包括跟企业合作的横向项目,有别于一般只申请纵向项目的基础数学家),总的来说就是活更杂。所以,很大一部分应用数学家也烦数学证明,虽然他们也有能力写证明,但是非到不得已不想去证明;虽然他们也能看懂证明,但是非到不得已,不想去看,不想去推。所以,怎么让你的证明过程描述非常“顺滑”,是一门艺术。宗旨就是:循序渐进,语言简洁,逻辑连贯。

数学论文的撰写和阅读的心得我们已经总结得很清晰了,但是初学者要真正看懂第一篇数学论文往往需要一个月或者数月的时间。这又是为何呢?因为,数学论文的撰写和阅读都需要非常扎实的数学基础,越好的期刊对数学基础要求越高,结果的刻画越“凸分析”,例如:MATHEMATICAL PROGRAMMING 和 SIAM JOURNAL ON OPTIMIZATION。所以,优化工作者得不断地学习和提高自己的数学能力,只有当你的数学基础真正过关了,你看文章写文章和效率才会真正提高。