ソースを参照

remove undesired <html> and <body> tags from bsoup

Tastalian 10 年 前
コミット
1e1f8999b9
共有1 個のファイルを変更した2 個の追加0 個の削除を含む
  1. 2 0
      extract_toc/extract_toc.py

+ 2 - 0
extract_toc/extract_toc.py

@@ -41,6 +41,8 @@ def extract_toc(content):
         toc.extract()
         toc.extract()
         content._content = soup.decode()
         content._content = soup.decode()
         content.toc = toc.decode()
         content.toc = toc.decode()
+        if content.toc.startswith('<html>'):
+            content.toc = content.toc[12:-14]
 
 
 
 
 def register():
 def register():