プログラミングマガジン

プログラミングを中心にIT技術をできるだけわかりやすくまとめます。

  • ホーム
  • Python
  • 【Python】scrapyからSQLite3へデータを保存するし、確認する。
 
 
     
  • サーバー言語  
    • Python
    • Ruby
    • PHP
    • SQL
  •  
  • インフラ  
       
    • AWS
    •  
    • 基本
    • Git
  • Web
       
    • Web開発
    • JavaScript
    • Vue.js
    • React
  •  
  • 設計  
       
    • 実装設計
    • DB設計
  • 問い合わせ
  

【Python】scrapyからSQLite3へデータを保存するし、確認する。

06.10

  • miyabisan2
  • コメントを書く

この記事は1分で読めます

SQLite3とは

インストール不要で使える手軽なRDBです。Pythonの環境にはデフォルトでインストールされているのでMySQL、PostgreSQLなどの本格DBで試すより、お試しでDB保存などをする場合はこれで十分でしょう。

登録処理

プロジェクト名/プロジェクト名/pipelines.py

pipelinesファイルでscrapyによるスクレイピング実行後に処理を記述します。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
class SQLitePipeline:
    def open_spider(self, spider):
        self.connection = sqlite3.connect('XXX.db')
        self.c = self.connection.cursor()
        try:
            self.c.execute('''
                CREATE TABLE テーブル名(
                    title text,
                    name text,
                )
            ''')
            self.connection.commit()
        except sqlite3.OperationalError:
            pass
 
    def process_item(self, item, spider):
        self.c.execute('''
            INSERT INTO テーブル名 (title,name)
            VALUES (?,?)
        '''),(
            item.get('title'),
            item.get('name'),
        ))
        self.connection.commit()
        return item
 
    def close_spider(self, spider):
        self.connection.close()

「CREATE TABLE」は、2度目以降はエラーになるのでtry exceptで例外処理をするようにします。

settings.py

settings.pyにpipelineの登録をします。

1
2
3
ITEM_PIPELINES = {
   "プロジェクト名.pipelines.SQLitePipeline": 300,
}

データを確認

VSCodeで確認できます。「sqlite」というプラグインを利用します。

XXX.dbというファイルが生成されているのでそれを右クリックで選択してひらけばVSCode上で内容を確認できます。

SELECT文を実行する。

1
2
3
4
5
6
import sqlite3
 
connection = sqlite3.connect('XXX.db')
cursor = connection.cursor()
for row in cursor.execute('SELECT * FROM テーブル名'):
    print(row)

 

 

 

スポンサーリンク
  • 2023 06.10
  • miyabisan2
  • コメントを書く
  • Python
  • Tweets Twitter
  • このエントリーをはてなブックマークに追加
  • LINEで送る

関連記事

  1. 2023 05.30

    【Python】Anacondaの使い方メモ

  2. 2023 06.11

    【Python】スプレットシート操作

  3. 2023 06.24

    【Python】PySimpleGUIについて

  4. 2023 05.30

    【Python】スクレイピング結果をCSVに保存する。

  5. 2023 06.16

    【Python】WindowsでAnacondaを使った環境構築

  6. 2023 07.20

    【Python】ValueError: Timeout value connect was エラーの対処

  • コメント ( 0 )
  • トラックバック ( 0 )
  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

返信をキャンセルする。

【NoSQL】MongoDBの基本

【Python】ScrapyのImagePipelin…

RETURN TOP

著者プロフィール

エンジニア歴10年で過去に業務系、Webデザイン、インフラ系なども経験あります。現在はWeb系でフロントエンド開発中心です。

詳細なプロフィールはこちら

スポンサーリンク

カテゴリー

  • Android
  • AngularJS
  • API
  • AWS
  • C++
  • CSS
  • cursor
  • C言語
  • DDD
  • DevOps
  • Django
  • Docker
  • Figma
  • Git
  • GitLab
  • GraphQL
  • gRPC
  • Hasura
  • Java
  • JavaScript
  • Kubernetes
  • Laravel
  • linux
  • MySQL
  • Next.js
  • nginx
  • Node.js
  • NoSQL
  • Nuxt.js
  • Oracle
  • PHP
  • Python
  • React
  • Redux
  • Rspec
  • Ruby
  • Ruby on Rails
  • Sass
  • Spring Framework
  • SQL
  • TypeScript
  • Unity
  • Vue.js
  • Webサービス開発
  • Webデザイン
  • Web技術
  • インフラ
  • オブジェクト指向
  • システム開発
  • セキュリティ
  • その他
  • データベース
  • デザインパターン
  • テスト
  • ネットワーク
  • プログラミング全般
  • マイクロサービス
  • マイクロソフト系技術
  • マルチメディア
  • リファクタリング
  • 副業
  • 未分類
  • 業務知識
  • 生成AI
  • 設計
  • 関数型言語
RETURN TOP

Copyright ©  プログラミングマガジン | プライバシーポリシー