妩媚柜子的博客_Apple Mac,Windows 10,Mysql,Android,leetcode,爬虫领域博主

妩媚柜子

文章

资源

加入时间

4年6月9天

7 爬虫爬取网页文章（保留图片和文本顺序，原封不动）的数据库设计，且避免重复抓取...1 设计思考 2 数据库的设计 3 数据库完整代码和测试代码

1 设计思考1.1 关于爬取文章存储的思考第一，文章要抓取到本地；第二，查询文件大小，如果文件过大，超出多少M，则新建一个主题文件比如：file="./"+"微信文章_"+key+编号+".html"。我从多个html中提取信息，然后写入到同一个html中。（可以参见精通python网络爬虫的第六章中的爬取微信搜索平台。但是本文远比它复杂）关于mongodb数据库的设计：首先是...

爬虫 2023-12-03 214 点赞 3 评论 324 浏览

[leetcode]1. 两数之和

个人博客：https://javaniuniu.com/难度：简单本题涉及算法：前缀和暴力哈希表思路：前缀和暴力哈希表类似题型：题目 1. 两数之和给定一个整数数组 nums 和一个目标值 target，请你在该数组中找出和为目标值的那两个整数，并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是，数组中同一个元素不能使用两遍。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] .

leetcode 2023-11-01 229 点赞 3 评论 346 浏览