前言

谈论所谈论的

一场持久的追踪

从去年九月到今年五月,我持续追踪着毕业所需的内容。
并记录下来,为我所用。
也许只是闲的蛋疼,但是对我而言亦有参考价值。

当我们谈及实习

实习,倒不如说是学校的无理要求。
谁家学校只认12月之后的实习呢?
之前的实习似乎就当是作废了。
并且还要在小程序持续打卡,
属实折磨。

别的不提了,就是说这个提交材料也是很傻逼,需要营业执照。
最后就是还得录视频,写实习报告。
就是两个字:麻烦。

毕业设计,论文,以及字里行间的格式

论文的话,内容几天就写完了,但是格式校对确实痛苦。
不仅要校对字体,还有段落缩进,行间距等,
对于wps苦手而言太难过了。

对于毕业设计而言,由于写的是机器学习,所以并不是很侧重于实现。
机器学习还是侧重于如何训练模型的,
假如写的系统,那就不一样了。

答辩,不止于答辩

同样的,参加了答辩,发现是真的多人写系统啊 XD
换言之,假如你不写系统,那就能得到高分。
毕竟审美疲劳了啊。

我们这一组还是很严格的,答辩也是按着流程走,
当然,大多数人还是很离谱的,一眼看出真的不怎么会 XD
当然,这种人老师也是不会放过,狠狠骂就是了。

总结

并不恐怖,只是需要用心。
无论是系统还是机器学习,无论是论文还是毕业设计。
老师并不在乎你是否做的好,只在乎你做的是否用心。
好不好需要一定能力去判断,但是用不用心一眼就知。


实习

关于实习报告

内容

实习报告正文内容原则上要求包括以下内容(如个别专业有不同要求的,院系可根据实际向学生另作要求):

  1. 实习目的(或研究目的) 
  2. 实习内容(或完成的实习任务)
  3. 实习效果、实习体会
  4. 对实习的意见、建议

要求

  1. 内容充实,文句通顺,语言流畅,无错别字。
  2. 按国家规定的绘图标准绘制图表,图表整洁,布局合理,不徒手画制图表。
  3. 毕业实习、教育实习类的实习报告字数为3000—5000字,专业实习(见习)报告字数不少于1500字。
  4. 实习报告用A4纸张,纵向横排。

实习类型

类型 转正HC 时间周期 竞争难度
暑期实习 3-6个月 ⭐⭐⭐⭐
日常实习 灵活 ⭐⭐

日常实习

虽然日常实习很少有HC,
但是无论如何也是夯实基础,积累经历的渠道。
所以不要觉得日常实习就不如暑期实习。

暑期实习

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
gantt  
title 2025年暑期实习进程
dateFormat YYYY-MM
section 关键节点
网申投递 :active, 2025-03, 30d
笔试测评 :crit, 2025-03, 14d
技术面试 :crit, 2025-04, 30d
实习入职 :milestone, 2025-05, 1d
转正答辩 :milestone, 2025-08, 1d
```
## 如何投递?
### 投递渠道整理
1. **官网直投**
2. **BOSS直聘**
3. **内推通道**
- 牛客网内推专区(每日更新)
- 校友资源(优先联系直系学长)

### 校招信息汇总

| 类别 | 届别/名称 | 整理者 | 官网链接 | 仓库链接 | 备注 |
| ------ | ----------- | -------------- | -------------------------------------------------------- | ------------------------------------------------------------------------ | -------------------------------------------------- |
| 校招信息汇总 | 2025届校招信息汇总 | NAOSI-DLUT | [项目官网](https://campus2025.top) | [项目仓库](https://github.com/NAOSI-DLUT/Campus2025) | |
| 校招信息汇总 | 2024届校招信息汇总 | NAOSI-DLUT | [项目官网](https://campus2024.top) | [项目仓库](https://github.com/NAOSI-DLUT/Campus2024) | |
| 校招信息汇总 | 2023届校招信息汇总 | gp868 | 无 | [项目仓库](https://github.com/gp868/2023-campus-recruitment-for-IT-industry) | |
| 求职攻略 | AI算法岗求职攻略 | amusi | 无 | [项目仓库](https://github.com/amusi/AI-Job-Notes) | 涵盖校招时间表、准备攻略、刷题指南、内推、AI公司清单和答疑等资料。 |
| 内推资源分享 | 内推资源分享 | CyC2018 | 无 | [项目仓库](https://github.com/CyC2018/Job-Recommend?tab=readme-ov-file) | 包含内推联系方式;内推仅加速流程,不提高通过率;可通过内推人查询简历进度。 |
| 面经分享 | Datawhale面经 | datawhalechina | [项目官网](https://youngfish42.github.io/daily-interview/#/) | [项目仓库](https://github.com/datawhalechina/daily-interview) | 涵盖机器学习、CV、NLP、推荐、开发等;算法岗重点AI算法、数据结构;开发岗重点开发、计算机基础。 |
| 污点记录 | 校招污点记录 | forthespada | 无 | [项目仓库](https://github.com/forthespada/CampusShame) | 截至发布最新为24届(2023秋);记录毁意向书、三方协定、试用期裁员等行为;信息来自公开论坛。 |

---
# 毕业论文
## 论文基本步骤
### 对于机器学习相关论文
1. 引言(背景,相关研究,本文内容)
2. 相关原理
3. 基于......方法(模型),对......的研究
4. 实验分析
1. 对比实验
2. 消融实验 <没有也行,有就很棒了>
3. 一些相关的图表,结果分析
5. 总结于展望 ]]
6. 摘要(对整个论文的概括,所以留到最后写

> 基本上来看可以分为三部分:(.1 .2) 部分方便水字数 (.3 .4) 是需要关注的核心内容 (.5 .6) 则是总结型,虽然不是最重要,但是我们不能一开始就写对吧。

### 信息系统相关论文
我不到啊

## 流程示意
### 毕业论文时间线
```mermaid
timeline
title 毕业论文流程时间线

九月初: 师生互选
十月底: 确认导师
十一月中: 提交开题报告
来年三月中: 提交初稿
来年三月下: 相似性检测
来年三月底: 论文盲审
来年四月底: 论文答辩
来年五月初: 提交终稿

提交材料脉络

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
flowchart LR
A[开题报告]
B[中期检查]
C[个人自我评价]
D[文献综述]
E[毕业设计(论文)过程版]
F[毕业设计(论文)盲审版]
G[毕业设计(论文)最终版]
H[归档材料]

A --> B
B --> C
C --> D
D --> E
E --> F
F --> G
G --> H

工具资源汇总

查重

工具名称 官网地址 描述
PapeRed https://www.paperred.com/ 无限免费查重
PaperCrazy www.papercrazy.cn 无限免费查重
超星尔雅 https://dsa.dayainfo.com/ 免费五次
PaperFree https://www.paperfree.cn/ 10000字免费
PaperPass https://www.paperpass.com/ 10000字免费
PaperOk http://www.paperok.com/ 10000字免费
PaperTime https://www.papertime.cn/ 10000字免费
PaperPP https://www.paperpp.com/ 5000字免费
PaperYY https://www.paperyy.com/ 每天一次
PaperWord https://www.paperword.com/ 每天一次
PaperAsk https://www.paperask.com/ 每天一次
论文狗 https://www.lunwengo.net/ 每天一次
学信网 https://www.chsi.com.cn/ 应届生查重一次
PaperLike https://www.paperlike.com/ 免费一次
PaperCcb https://www.paperccb.com/ 免费一次
PaperEra https://www.paperera.com/ 首篇免费
维普 https://www.cqvip.com/ 应届生查重一次
万方 https://www.wanfangdata.com.cn/ 应届生查重一次
Paperpro https://www.paperpro.com/ 修改文质量很高
秘塔写作猫 https://xiezuocat.com/ 可以免费降重5000字
火龙果写作 https://www.mypitaya.com/ 每天免费降重3000字

AIGC检测

工具名称 官网地址 主要功能 特点
千笔 AI 论文 https://www.aipaperpass.com 提供AIGC检测和降重功能,支持上传AIGC检测报告或论文原文,自动处理AI生成内容 降重结果支持知网、维普、万方等权威查重平台检测
PaperTT https://www.papertt.com 精准识别AIGC内容,提供详细的检测报告,包括AIGC风险评估和可疑段落标记 检测速度快,用户界面友好,适合新手使用
MitataAI https://www.mitataai.com 深入剖析论文内容,精准揪出AIGC成分,支持一键降AIGC率 免费且检测结果准确可靠
笔灵AI https://ibiling.cn 提供降AIGC痕迹功能,基于顶尖算法还原人类写作风格 采用阿里云安全储存,加密传输,保障论文信息安全
AIQuora https://www.aiquora.com 基于第四代NLP的超拟人文本改写系统,支持手动和自动降AIGC率 支持中文论文处理,提供普通、中等、强力三种降AIGC等级
天目 https://tianmu.people.cn 精准识别AI生成内容,支持DOC和TXT格式,单次可处理10万字文本 高亮显示AI生成句段,生成PDF格式检测报告,数据隐私保护
Smodin AI检测器 https://smodin.io 区分人工编写内容和AI生成文本,提供改进建议 支持多种语言,适用于学术、教育、专业场景
知网AIGC检测 https://aicheck.oversea.cnki.net 针对中文文献的AIGC检测,结果权威准确 需通过学校或机构获取使用权限
万方AIGC检测 https://www.wanfangdata.com.cn 提供全面的AIGC检测功能,支持版权保护和内容原创性验证 部分高校和科研机构有购买服务
免费AI检测器 https://notegpt.io 支持文本、图片、内容检测,无需登录,快速精准 完全免费,操作简单,适合内容创作者和研究人员

关于文献综述

参考

【本科毕业生 - 如何写好毕业论文的参考文献和文献综述】


总结

  1. 引用的文章主要就是两点:时间近、等级高。
  2. 似乎文献综述并不是必要选项,视频中也出现了直接合并到1.3章节国内外研究现状章节中

如何写好一篇论文文献综述

文献综述是学术论文中的重要组成部分,它不仅展示了你对研究领域的了解,还为你的研究提供理论基础。

准备阶段

  1. 明确研究问题:确定你的研究问题和目标,这将指导你的文献检索方向。
  2. 系统检索文献
    • 使用多个学术数据库(如Web of Science、Scopus、Google Scholar)
    • 设计合适的关键词组合
    • 关注高引用文章、经典文献和最新研究
    • 记录检索策略,便于复现
  3. 筛选和组织文献
    • 阅读摘要进行初步筛选
    • 建立文献管理系统(如Zotero、Mendeley、EndNote)
    • 按主题、方法或时间线分类文献

撰写阶段

  1. 确定综述结构
    • 主题式结构:按研究主题或概念组织
    • 时间线结构:按研究发展脉络组织
    • 方法论结构:按研究方法组织
    • 结果导向结构:按研究结果组织
  2. 写作内容要点
    • 引言:说明综述目的和范围
    • 主体:对文献进行分析、比较和评价
    • 结论:总结现有研究状况,指出研究空白
  3. 批判性分析
    • 不只是简单罗列研究,而是分析它们之间的联系
    • 评价研究的优缺点、局限性和贡献
    • 识别研究趋势、争议点和研究空白

提升质量的技巧

  1. 建立对话:让不同文献之间形成对话,而不是孤立地描述每项研究
  2. 避免过度引用:每个观点选择最相关的文献支持,不需要穷尽所有相关文献
  3. 保持客观:公正评价各种观点,即使与你的假设不符
  4. 清晰的主线:每个段落有明确的主题句,段落之间有逻辑过渡
  5. 定期更新:在论文完成前,持续关注新发表的文献

常见问题避免

  1. 避免简单堆砌:不要仅仅列出”A说了什么,B说了什么”
  2. 避免过度引用次要文献:优先引用原创研究而非其他综述
  3. 避免选择性引用:不要只引用支持你观点的文献
  4. 避免过时文献:确保包含该领域最新进展

一篇好的文献综述能够清晰地展示研究领域的现状,识别知识空白,并为你的研究提供合理的理论基础。通过系统、批判性地分析文献,你可以展示自己的学术素养并提高论文的质量。


毕业答辩,如何准备?

#0 前言

毕业答辩并不可怕,可怕的是对未知的恐惧

回想起之前和老师沟通的时候,老师也总是强调:
“只要不是太离谱,没人会故意为难你。”
很正常,谁没事故意卡人呢?大家都无冤无仇的。
只是要做到一件事情,那就是,至少你得对你写的东西负责,你得知道讲什么。

#1 我干了什么?

#1.1 一切从工作量出发

老师只是希望看到你的成果,也就是工作量。
“你做了什么?怎么做的?做了多久?”
大概也就是这些问题。

老师并不可能一直盯着你做毕设,对吧?
所以老师如何检查工作量?无非三个途径
1. 从你的毕业论文
2. 从毕业设计的演示视频(或者线下演示)
3. 最后就是答辩的询问
所以,抓住这三点,从这三点出发。

#1.2 如何做?

很简单,大体而言,我采用 D.D.D(Domain Drive Design)的设计思路
也就是 领域驱动设计 的想法。
何为领域驱动设计?
简单而言,就是以涉及业务作为核心,划分相关的领域,
将相关的概念填充至领域中,然后将各个概念关联起来。
沿着每个概念之间的脉络,我们可以很轻松的把控整个领域,
从而掌握全局。

而映射到我们论文答辩,那则是先厘清我们的业务(论文主题),
然后围绕论文主题建立 领域(Domain),再仔细的填充我们的领域。

#2 构建领域

#2.1 唯一核心

机器学习论文,核心就在于机器学习,
好像看起来是一句废话,但是并不废话。

机器学习是什么?很宽泛,但是总体会有一个操作流程。
从这个操作流程出发,我们可以从这个切面中去描述什么是机器学习。

前期准备 -> 构建模型 -> 评估模型

把握这个最核心的流程,也就是体现自己工作量的关键。

#2.2 把握主题

主题是必须把握的,所有的问题都会围绕它展开
在“基于深度学习(DL)和大语言模型(LLM)的花卉识别系统”
这个语境下的主题,是我们的“深度学习”和“花卉识别”
而细枝末节则是“大语言模型”。

我们的主要目的还是要建立一个基于“深度学习”的“花卉识别”模型
然后将这个模型和现有的“大语言模型”结合起来,所谓的 多模态
而这个 多模态 也就是我们的创新点。

所以,“花卉识别”模型是基础,“多模态”是创新点。
我们先阐明自己如何构建“花卉识别”模型的,然后再提及“多模态”的事情。

#3 填充概念

#3.1 前期准备

构建一个良好的神经网络模型,必不可少的就是优质的数据集。
如何构建一个优质数据集,需要从很多方面入手
但是大体流程就是:

数据收集(数据扩充) -> 数据清洗 -> 数据强化(可选)

而其他的细节,也写在论文里面了

#3.2 模型构建(模型训练)


在论文里面已经提到了,其实跟着论文走就好了
主要就是掌握 tensorflow框架 是如何进行 数据集划分,数据集准备的,
还有如何利用 tensorflow api 进行模型构建
我们使用的是迁移学习,所以就要提到基座模型是什么,怎么进行迁移学习的(还有一些针对迁移学习的特殊处理)。

#3.3 模型评估


同样的,跟着论文走。
就是要提到一些相关的评估函数的概念
不过这些概念,在第二章有提及:

也不再赘述

#3.4 小结

也就是说,答辩的方法就是紧贴着论文和代码走,
毕竟老师了解你的工作的唯一途径只有论文和代码嘛。

#4 来自提问者

#4.1 假如角色互换

想想如果你是老师,你会问什么?
如果你是老师,你会做什么?
到了现场,无非就是打开电脑演示内容,只不过相对于系统设计,
机器学习论文“更偏向你是如何训练的”。
所以如果我是老师,我会围绕着“你是怎么训练这个模型”去发问。
这个时候上面构建的领域就派上了用场,
从领域中挑出概念一一回复吧。

#4.2 把握节奏,引导话题

实际上,答辩和面试没什么区别,
都需要我们把握话题节奏,将话题引导到有利于我们的地方。
人不可能知道所有东西,我们构建的领域再完善也有可能有纰漏。
所以,我们要拿到话题的主导,将话题引到我们的“舒适区”。
而对于自己不懂的,就不要提及了。