Archives

32 Posts

Dec, 2020

根据 Star 数爬取 GitHub 仓库

首先导入需要使用到的包,并且设定 headers: 123456import requestsimport timefrom bs4 import BeautifulSoupheaders = {"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537

Sep, 2020

《加州旅馆》中文版

闲来无事翻看自己的 b 站收藏夹,找到了一首很旧的老歌,《加州旅馆》。不是原版,是一位厨师改编的中文版,现在再听,在这异国他乡,想到自己的漂泊无所依的人生,突然多了许多感悟。 原地址在此:https://www.bilibili.com/video/BV1Mx411w7S4 走在空荡的街上枯叶随风飘荡仍是无眠的夜晚走的没有方向来到这城市两年却没有归宿感以回不去我来的故乡只为了梦想那就想远处的灯火仍然飘渺遥远但始终有微微的光亮让我继续向前转身走向地下道拿起红木吉他轻轻弹起那旋律放声自由唱这就是我

卷王

8 月份实习完到现在,过了快 1 个月十分随意的生活了。 每天熬到 1-2 点再睡觉,早上醒了后懒在床上用手机刷直播,直到饿了才起床去做午饭。下午和晚上也没有看书和学习的欲望,睡个午觉,再玩会儿游戏,晚上泡个澡,一天便这样过去了。 确实是很轻松的生活,不过也渐渐感受到了点焦虑。毕竟相比自己的慵懒,旁边的朋友则都是忙忙碌碌,找工作,申请 PhD。担心自己没有利用好这段自由的时间,只是简单地玩耍了过去,担心没有做到提升自己。和朋友聊了自己的焦虑,却被朋友批评道,“你这是卷王的心态”,既然现在没什

Jul, 2020

2020 年中总结

本来以为今年会是轻松的一年,拿到了 summer internship,选的课也比较轻松,没想到却遇上了 covid-19。年初的时候立下了蛮多 flag,已经到了年中,还是做个总结吧。 ✅ 代表做的还不错,❎ 代表下半年要努力了。 ❎ 读十本书:基本就读了课本… 下半年多看看书,少看 b 站,争取把阅读笔记的坑补上。 ✅ 300天LC打卡:还不错,除了 5 月考试周基本上每天有坚持,不过最近有点懈怠,要坚持✊。 ❎ 瘦到60kg:现在70+kg,原地踏步… ❎ 学会一门乐器:没开始,进

Jun, 2020

CSS 实现鼠标划过卡片上浮效果

/* 核心样式 */ .card { padding: 10px; width: 300px; height: 180px; background-color: #FFF; border: none; border-radius: 6px; -webkit-transition: all 250ms cubic-bezier(0.02, 0.01, 0.47, 1); transition: all 250ms cubic

期末结束快半个月,实习也开始一周之后,拖延症严重的我终于来写年中总结了。 感觉来 NYU 读书应该是读本科以来课程 pressure 最轻松的日子了,相比大三无止尽的熬夜写项目,一学期只需要应付 3 门课程而且还有厉害的组员,这样的日子对我着实有一些清闲。 不过我觉得清闲地有一些过头了。 与之前相比,我的各种缺点也是更加明显。更懒、更拖延、更没有时间安排,得过且过。或许人一旦陷入了一种清闲的日子,就会渐渐被磨平棱角,没有了奋斗的动力。 我到底热爱什么呢?这是一年来我一直在问自己的问题。无所依,

Apr, 2020

Poor Man's BERT 论文笔记

本文采取了 Layer-dropping 的策略,在 pre-trained model 上进行微调,从而实现模型压缩。本文提出的 model 与原始的 BERT、RoBERTa 和 XLNet 相比,可以达到 40% 的减枝效率,同时维持 98% 的准确度。 代码地址:https://github.com/hsajjad/transformers 论文地址:https://arxiv.org/pdf/2004.03844v1.pdf Layer-dropping 策略删去 Top-Laye

Mar, 2020

FlowSense 论文笔记

随意记录一下阅读论文中的启发和一些重要的点,可能顺序比较混乱,哈哈。 系统简介作者将 Natural language interface(NLI)和 Dataflow visualization systems(DFVS)结合,构建了 FlowSense 系统。这个系统利用 NL 技术减少数据流图的学习开销。这个系统通过语义分析,为数据流图中的内容加上一些 tag,并且这些 tag 是内容独立的,不受数据集影响,用户可以与这些 tag 进行交互,从而更好理解结果,方便 bug 搜寻。 Natu

Feb, 2020

Hexo 添加文章字数和阅读时长

安装文章字数和阅读时长的统计都是借助 hexo-wordcount 插件实现,可以使用 npm 或者 yarn 安装: 123yarn add hexo-wordcount# ornpm i --save hexo-wordcount Node 版本在 7.6.0 之前,请安装 2.x 版本: 1npm i --save hexo-wordcount@2 配置在主题的配置文件 _config.yml 中添加如下 hexo-wordcount 插件的配置说明: 1234567# Post wor

全域哈希推导

在 CLRS 上看到了 Chapter 12,讲解了 Hash 相关的内容,其中关于全域哈希(universal hash)和完美哈希(perfect hash)看的不是很懂。后来补了 MIT 的算法导论公开课,稍微弄懂了一些。这里做一个关于全域哈希简单的推导,加强记忆。 普通哈希函数的缺陷对于一个给定的哈希函数 $h$ ,存在着一个明显的缺陷:我们总能找到一套特殊的 keys $K$,使得 $K$ 中的 $\forall k \in K$,其 $h(k)$ 均相等。这样的哈希函数的会导致