第5关：多级页面爬取

📋 任务目标

这一关需要爬取两层页面：

第一步：从当前列表页提取所有书籍的详情页链接
第二步：访问每个详情页，提取完整的书籍信息
第三步：汇总所有书籍的详细信息

💡 提示

1. 先提取所有详情页的链接

2. 循环访问每个详情页

3. 从详情页提取完整信息

import requests
from bs4 import BeautifulSoup

# 第一步：获取列表页
url = 'https://req.haleibc.com/level5'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

# 第二步：提取详情页链接
detail_links = []
for link in soup.find_all('a', class_='detail-link'):
    detail_url = 'https://req.haleibc.com' + link['href']
    detail_links.append(detail_url)

# 第三步：访问每个详情页
for detail_url in detail_links:
    response = requests.get(detail_url)
    soup = BeautifulSoup(response.text, 'html.parser')
    # 提取详情页的信息...

📚 图书列表

小王子

作者：圣埃克苏佩里

¥25.0

查看详情

哈利波特与魔法石

作者：J.K.罗琳

¥35.0

查看详情

夏洛的网

作者：E.B.怀特

¥22.0

查看详情

了不起的狐狸爸爸

作者：罗尔德·达尔

¥28.0

查看详情

窗边的小豆豆

作者：黑柳彻子

¥30.0

查看详情

✅ 期望结果

应该爬取到 5 本书的详细信息

每本书包含：书名、作者、价格、简介、出版信息等

第5关：多级页面爬取 ⭐⭐

📋 任务目标

💡 提示

📚 图书列表

小王子

哈利波特与魔法石

夏洛的网

了不起的狐狸爸爸

窗边的小豆豆

✅ 期望结果