sqlite¶

../../../_images/jandira-sonnendeck-AcW1ZwD-qC0-unsplash.jpg

El módulo sqlite3 permite trabajar con bases de datos de tipo SQLite 1.

¿Qué es SQLite?¶

SQLite es un sistema gestor de bases de datos relacional contenido en una pequeña librería escrita en C (~275kB).

A continuación se muestran algunas de sus principales características:

Tablas, índices, «triggers» y vistas ilimitadas.
Hasta 32K columnas en una tabla y filas ilimitadas.
Índices multi-columna.
Restricciones de tipo CHECK, UNIQUE, NOT NULL y FOREIGN KEY.
Transacciones planas usando BEGIN, COMMIT y ROLLBACK
Transacciones anidadas usando SAVEPOINT, RELEASE y ROLLBACK TO.
Subconsultas.
«Joins» de hasta 64 relaciones.
«Joins» de tipo «left», «right» y «full outer».
Uso de DISTINCT, ORDER BY, GROUP BY, HAVING, LIMIT y OFFSET.
Uso de UNION, UNION ALL, INTERSECT y EXCEPT.
Una amplia librería de funciones SQL estándar.
Funciones de agregación.
Funciones de ventana.
Por supuesto el uso de UPDATE, DELETE e INSERT.
Cláusula UPSERT.
Soporte para valores JSON.

Y muchas otras que se pueden consultar en la página del proyecto.

Conexión a la base de datos¶

Una base de datos SQLite no es más que un fichero binario, habitualmente con extensión .db o .sqlite. Antes de realizar cualquier operación es necesario «conectar» con este fichero.

La conexión a la base de datos se realiza a través de la función connect() que espera recibir la ruta al fichero de base de datos y devuelve un objeto de tipo Connection:

>>> import sqlite3

>>> con = sqlite3.connect('python.db')

>>> con
<sqlite3.Connection at 0x106ea8210>

Advertencia

El módulo se llama sqlite3 (no olvidarse del 3 al final).

La función connect() creará el fichero python.db (si es que no existe ya). En un principio no tiene contenido alguno:

>>> !file python.db
python.db: empty

Una vez que disponemos de la conexión ya podemos obtener un Cursor mediante la función cursor(). Un cursor se podría ver como un manejador para realizar operaciones sobre la base de datos:

>>> cur = con.cursor()

>>> cur
<sqlite3.Cursor at 0x106a63960>

Creación de tablas¶

Para poder crear una tabla primero debemos manejar los tipos de datos SQLite disponibles. Aunque hay alguno más, con los siguientes nos será suficiente para la inmensa mayoría de diseños de bases de datos que podamos necesitar:

INTEGER para valores enteros.
REAL para valores flotantes.
TEXT para cadenas de texto.

Prudencia

Aunque INT también está permitido, se desaconseja su uso en favor de INTEGER especialmente cuando trabajamos con la librería Python sqlite3 y no queremos obtener resultados inesperados.

Durante toda esta sección vamos a trabajar con una tabla de ejemplo que represente las distintas versiones de Python que han sido liberadas.

Empecemos creando la tabla pyversions a través de un código SQL similar al siguiente:

CREATE TABLE pyversions (
    branch TEXT PRIMARY KEY,
    released_at_year INTEGER,
    released_at_month INTEGER,
    release_manager TEXT
)

Haremos uso del cursor creado para ejecutar estas instrucciones:

>>> sql = """CREATE TABLE pyversions (
...     branch TEXT PRIMARY KEY,
...     released_at_year INTEGER,
...     released_at_month INTEGER,
...     release_manager TEXT
... )"""

>>> cur.execute(sql)
<sqlite3.Cursor at 0x106a63960>

Consejo

Las cadenas multilínea son grandes aliadas a la hora de escribir sentencias SQL.

Ya hemos creado la tabla pyversions de manera satisfactoria.

Si comprobamos ahora el contenido del fichero python.db podemos observar que nos indica la versión de SQLite y la última escritura:

>>> !file python.db
python.db: SQLite 3.x database, last written using SQLite version 3032003

Añadiendo datos¶

Para tener contenido sobre el que trabajar, vamos primeramente a añadir ciertos datos a la tabla. Como básicamente seguimos ejecutando sentencias SQL (en este caso de inserción) podemos volver a hacer uso de la función execute():

>>> sql = 'INSERT INTO pyversions VALUES ("2.6", 2008, 10, "Barry Warsaw")'

>>> cur.execute(sql)
<sqlite3.Cursor at 0x106a63960>

Aparentemente todo ha ido bien. Vamos a usar – temporalmente – la herramienta cliente sqlite3 2 para ver el contenido de la tabla:

$ sqlite3 python.db "select * from pyversions"
$ # Vacío

Resulta que no obtenemos ningún registro. ¿Por qué ocurre esto? Se debe a que la transacción está aún pendiente de confirmar. Para consolidarla tendremos que hacer uso de la función commit():

>>> con.commit()

Ver también

Cada vez que usamos la función execute() comienza una nueva transacción a la base de datos que debe confirmarse con commit() o bien deshacerse con rollback().

Ahora podemos comprobar que sí se han guardado los datos correctamente:

$ sqlite3 python.db "select * from pyversions"
2.6|2008|10|Barry Warsaw

Nota

La función commit() pertenece al objeto conexión, no al objeto cursor.

Inserciones parametrizadas¶

Supongamos que no sabemos, a priori, los datos que vamos a insertar en la tabla puesto que provienen del usuario o de otra fuente externa. En este caso cabría plantearse cuál es la mejor opción para parametrizar la consulta.

Usando f-strings¶

Una primera aproximación podrían ser los f-strings a través de una simple interpolación de variables. Veamos un ejemplo de ello:

>>> branch = 3.9
>>> released_at_year = 2020
>>> released_at_month = 10
>>> release_manager = 'Łukasz Langa'

>>> sql = f'INSERT INTO pyversions VALUES ({branch}, {released_at_year}, {released_at_month}, {release_manager})'
>>> sql
'INSERT INTO pyversions VALUES (3.9, 2020, 10, Łukasz Langa)'

>>> cur.execute(sql)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
OperationalError: near "Langa": syntax error

Obtenemos un error porque el contenido de «release manager» es una cadena de texto y no puede contener espacios. Una solución a este problema sería detectar qué campos necesitan comillas e incorporarlas de forma manual.

Usando placeholders SQLite¶

Pero existe otra aproximación y es usar los «placeholders» que ofrece SQLite al ejecutar sentencias. Estos «placeholders» se representan por el símbolo de interrogación ? y se sustituyen por el valor correspondiente en una tupla (o iterable) que pasamos como parámetro a posteriori.

Veamos cómo sería esta reimplementación:

>>> sql = 'INSERT INTO pyversions VALUES (?, ?, ?, ?)'

>>> cur.execute(sql, (branch, released_at_year, released_at_month, release_manager))
<sqlite3.Cursor at 0x107426c40>

Ahora sí que todo ha ido bien y no nos hemos tenido que preocupar del tipo de los campos. Ya sólo por esto valdría la pena utilizar esta aproximación pero también ayuda a evitar ataques por inyección SQL 4.

Prudencia

Cuando sólo haya un «placeholder» hay que recordar que las tuplas de un único elemento necesitan una coma al final: cur.execute('INSERT INTO table (column) VALUES (?)', (value,))

En estos casos quizás sea incluso más sencillo pasar una lista de un elemento: [value]

Este módulo nos ofrece igualmente la posibilidad de usar parámetros nominales a través de un diccionario especificando los campos con dos puntos :field. Veamos cómo sería esta aproximación:

>>> sql = 'INSERT INTO pyversions VALUES (:branch, :year, :month, :manager)'

>>> cur.execute(sql, dict(year=2020, month=10, branch=3.9, manager='Łukasz Langa'))
<sqlite3.Cursor at 0x107426c40>

Truco

Nótese que no es necesario usar el mismo orden de los parámetros cuando utilizamos esta aproximación nominal ya que el diccionario incluye las claves.

Inserciones en lote¶

Vamos a pensar en un escenario algo más real, en el que necesitamos insertar en la tabla más de un registro. Obviamente la solución programática no puede ser ir de uno en uno.

Supongamos que disponemos del siguiente fichero pyversions.csv:

branch,year,month,manager
6,2008,10,Barry Warsaw
7,2010,7,Benjamin Peterson
0,2008,12,Barry Warsaw
1,2009,6,Benjamin Peterson
2,2011,2,Georg Brandl
3,2012,9,Georg Brandl
4,2014,3,Larry Hastings
5,2015,9,Larry Hastings
6,2016,12,Ned Deily
7,2018,6,Ned Deily
8,2019,10,Łukasz Langa
9,2020,10,Łukasz Langa
10,2021,10,Pablo Galindo Salgado
11,2022,10,Pablo Galindo Salgado
12,2023,10,Thomas Wouters

Queremos procesar cada línea e insertarla en la tabla como un nuevo registro. Veamos una primera aproximación:

>>> with open('pyversions.csv') as f:
...     f.readline()  # ignore headers
...     for line in f:
...         branch, year, month, manager = line.strip().split(',')
...         sql = f'INSERT INTO pyversions VALUES ("{branch}", {year}, {month}, "{manager}")'
...         cur.execute(sql)
...     con.commit()
...

Pero este módulo permite atacar el problema desde otro enfoque utilizando la función executemany(). Esta función admite un iterable de iterables (con el mismo número de campos que la tabla) desde donde recupera los datos:

>>> f = open('pyversions.csv')
>>> data = [line.strip().split(',') for line in f.readlines()[1:]]
>>> data
[['2.6', '2008', '10', 'Barry Warsaw'],
 ['2.7', '2010', '7', 'Benjamin Peterson'],
 ['3.0', '2008', '12', 'Barry Warsaw'],
 ['3.1', '2009', '6', 'Benjamin Peterson'],
 ['3.2', '2011', '2', 'Georg Brandl'],
 ['3.3', '2012', '9', 'Georg Brandl'],
 ['3.4', '2014', '3', 'Larry Hastings'],
 ['3.5', '2015', '9', 'Larry Hastings'],
 ['3.6', '2016', '12', 'Ned Deily'],
 ['3.7', '2018', '6', 'Ned Deily'],
 ['3.8', '2019', '10', 'Łukasz Langa'],
 ['3.9', '2020', '10', 'Łukasz Langa'],
 ['3.10', '2021', '10', 'Pablo Galindo Salgado'],
 ['3.11', '2022', '10', 'Pablo Galindo Salgado'],
 ['3.12', '2023', '10', 'Thomas Wouters']]

>>> sql = 'INSERT INTO pyversions VALUES (?, ?, ?, ?)'
>>> cur.executemany(sql, data)
<sqlite3.Cursor at 0x104f3fb20>

>>> con.commit()

Si dispusiéramos de un diccionario podríamos indicar incluso el nombre de los campos:

>>> f = open('pyversions.csv')
>>> fields = f.readline().strip().split(',')
>>> data = [{f: v for f, v in zip(fields, line.strip().split(','))} for line in f]

>>> data
[{'branch': '2.6', 'year': '2008', 'month': '10', 'manager': 'Barry Warsaw'},
 {'branch': '2.7', 'year': '2010', 'month': '7', 'manager': 'Benjamin Peterson'},
 {'branch': '3.0', 'year': '2008', 'month': '12', 'manager': 'Barry Warsaw'},
 {'branch': '3.1', 'year': '2009', 'month': '6', 'manager': 'Benjamin Peterson'},
 {'branch': '3.2', 'year': '2011', 'month': '2', 'manager': 'Georg Brandl'},
 {'branch': '3.3', 'year': '2012', 'month': '9', 'manager': 'Georg Brandl'},
 {'branch': '3.4', 'year': '2014', 'month': '3', 'manager': 'Larry Hastings'},
 {'branch': '3.5', 'year': '2015', 'month': '9', 'manager': 'Larry Hastings'},
 {'branch': '3.6', 'year': '2016', 'month': '12', 'manager': 'Ned Deily'},
 {'branch': '3.7', 'year': '2018', 'month': '6', 'manager': 'Ned Deily'},
 {'branch': '3.8', 'year': '2019', 'month': '10', 'manager': 'Łukasz Langa'},
 {'branch': '3.9', 'year': '2020', 'month': '10', 'manager': 'Łukasz Langa'},
 {'branch': '3.10', 'year': '2021', 'month': '10', 'manager': 'Pablo Galindo Salgado'},
 {'branch': '3.11', 'year': '2022', 'month': '10', 'manager': 'Pablo Galindo Salgado'},
 {'branch': '3.12', 'year': '2023', 'month': '10', 'manager': 'Thomas Wouters'}]

>>> sql = 'INSERT INTO pyversions VALUES (:branch, :year, :month, :manager)'
>>> cur.executemany(sql, data)
<sqlite3.Cursor at 0x106e96030>

>>> con.commit()

En cualquiera de los tres casos anteriores el resultado es el mismo y los registros quedan correctamente insertados en la base de datos:

$ sqlite3 python.db "SELECT * FROM pyversions"
6|2008|10|Barry Warsaw
7|2010|7|Benjamin Peterson
0|2008|12|Barry Warsaw
1|2009|6|Benjamin Peterson
2|2011|2|Georg Brandl
3|2012|9|Georg Brandl
4|2014|3|Larry Hastings
5|2015|9|Larry Hastings
6|2016|12|Ned Deily
7|2018|6|Ned Deily
8|2019|10|Łukasz Langa
9|2020|10|Łukasz Langa
10|2021|10|Pablo Galindo Salgado
11|2022|10|Pablo Galindo Salgado
12|2023|10|Thomas Wouters

Identificador de fila¶

En el comportamiento por defecto de una base de datos SQLite todas las tablas disponen de una columna «oculta» denominada rowid o identificador de fila.

Esta columna se va rellenando de forma automática con valores enteros únicos y puede utilizarse como clave primaria de los registros.

Para poder visualizar (o utilizar) esta columna es necesario indicarlo explícitamente en la consulta:

$ sqlite3 python.db "SELECT rowid, * FROM pyversions"
2.6|2008|10|Barry Warsaw
2.7|2010|7|Benjamin Peterson
3.0|2008|12|Barry Warsaw
3.1|2009|6|Benjamin Peterson
3.2|2011|2|Georg Brandl
3.3|2012|9|Georg Brandl
3.4|2014|3|Larry Hastings
3.5|2015|9|Larry Hastings
3.6|2016|12|Ned Deily
3.7|2018|6|Ned Deily
3.8|2019|10|Łukasz Langa
3.9|2020|10|Łukasz Langa
3.10|2021|10|Pablo Galindo Salgado
3.11|2022|10|Pablo Galindo Salgado
3.12|2023|10|Thomas Wouters

Cerrando la conexión¶

Al igual que ocurre con un fichero de texto, es necesario cerrar la conexión abierta para que se liberen los recursos asociados y se debloquee la base de datos.

La forma más directa de hacer esto sería:

>>> con.close()

Atención

Si hay alguna transacción pendiente, esta no será guardada al cerrar la conexión con la base de datos, si previamente no se consolidan los cambios.

Gestor de contexto¶

En SQLite también es posible utilizar un gestor de contexto sobre la conexión, que funciona de la siguiente manera:

Si todo ha ido bien ejecutará un «commit» al final del bloque.
Si ha habido alguna excepción ejecutará un «rollback» para que todo quede como al principio y deshacer los posibles cambios efectuados.

Ejemplo en el que todo va bien:

>>> try:
...     with con:
...         cur.execute('INSERT INTO pyversions VALUES ("3.13", 2024, 10, "Thomas Wouters")')
... except sqlite3.IntegrityError:
...     print('Error: Duplicated Python version')
...

>>> con.close()

Ejemplo donde se produce un error:

>>> try:
...     with con:
...         cur.execute('INSERT INTO pyversions VALUES ("3.12", 2023, 10, "Thomas Wouters")')
... except sqlite3.IntegrityError:
...     print('Error: Duplicated Python version')
...
Error: Duplicated Python version

>>> con.close()

Nótese que en ambos casos debemos cerrar la conexión. Esto no se realiza de forma automática.

Es interesante conocer las distintas excepciones que pueden producirse al trabajar con este módulo a la hora del control de errores y de plantear posibles escenarios de mejora.

Consultas¶

La manera más sencilla de hacer una consulta es utilizar un cursor. Existen dos aproximaciones en el tratamiento de los resultados de la consulta:

Registros como tuplas.
Registros como filas.

Registros como tuplas¶

Cuando ejecutamos una consulta el resultado es un objeto iterable que podemos recorrer de la misma manera que hemos hecho hasta ahora. Los datos nos vienen en forma de tuplas:

>>> for row in cur.execute('SELECT * FROM pyversions'):
...     print(row)
...
('2.6', 2008, 10, 'Barry Warsaw')
('2.7', 2010, 7, 'Benjamin Peterson')
('3.0', 2008, 12, 'Barry Warsaw')
('3.1', 2009, 6, 'Benjamin Peterson')
('3.2', 2011, 2, 'Georg Brandl')
('3.3', 2012, 9, 'Georg Brandl')
('3.4', 2014, 3, 'Larry Hastings')
('3.5', 2015, 9, 'Larry Hastings')
('3.6', 2016, 12, 'Ned Deily')
('3.7', 2018, 6, 'Ned Deily')
('3.8', 2019, 10, 'Łukasz Langa')
('3.9', 2020, 10, 'Łukasz Langa')
('3.10', 2021, 10, 'Pablo Galindo Salgado')
('3.11', 2022, 10, 'Pablo Galindo Salgado')
('3.12', 2023, 10, 'Thomas Wouters')
('3.13', 2024, 10, 'Thomas Wouters')

También tenemos la opción de utilizar las funciones fetchone() y fetchall() para obtener una o todas las filas de la consulta:

>>> res = cur.execute('SELECT * FROM pyversions')

>>> res.fetchone()
('2.6', 2008, 10, 'Barry Warsaw')

>>> res.fetchall()
[('2.7', 2010, 7, 'Benjamin Peterson'),
 ('3.0', 2008, 12, 'Barry Warsaw'),
 ('3.1', 2009, 6, 'Benjamin Peterson'),
 ('3.2', 2011, 2, 'Georg Brandl'),
 ('3.3', 2012, 9, 'Georg Brandl'),
 ('3.4', 2014, 3, 'Larry Hastings'),
 ('3.5', 2015, 9, 'Larry Hastings'),
 ('3.6', 2016, 12, 'Ned Deily'),
 ('3.7', 2018, 6, 'Ned Deily'),
 ('3.8', 2019, 10, 'Łukasz Langa'),
 ('3.9', 2020, 10, 'Łukasz Langa'),
 ('3.10', 2021, 10, 'Pablo Galindo Salgado'),
 ('3.11', 2022, 10, 'Pablo Galindo Salgado'),
 ('3.12', 2023, 10, 'Thomas Wouters'),
 ('3.13', 2024, 10, 'Thomas Wouters')]

Prudencia

Nótese que la llamada a fetchone() hace que quede «una fila menos» que recorrer. Es un comportamiento totalmente análogo a la lectura de una línea en un fichero.

Registros como filas¶

Este módulo también nos permite obtener los resultados de una consulta como objetos de tipo Row lo que facilita acceder a los valores de cada registro tanto por el índice como por el nombre de la columna.

Para «activar» este modo tendremos que fijar el valor de la factoría de filas en la conexión:

>>> con = sqlite3.connect('python.db')
>>> con.row_factory = sqlite3.Row

Importante

Para que las consultas usen esta factoría hay que fijar el atributo row_factory antes de crear el cursor correspondiente.

Ahora creamos un cursor, ejecutamos la consulta y accedemos a la primera fila del resultado como si fuera un diccionario:

>>> cur = con.cursor()
>>> res = cur.execute('SELECT * FROM pyversions')

>>> row = res.fetchone()
>>> row
<sqlite3.Row at 0x107b76190>

>>> row.keys()
['branch', 'released_at_year', 'released_at_month', 'release_manager']

>>> row['branch']
'2.6'
>>> row['released_at_year']
2008
>>> row['released_at_month']
10
>>> row['release_manager']
'Barry Warsaw'

Pero también es posible seguir accediendo a la cada columna a través del índice:

>>> row[0]
'2.6'
>>> row[1]
2008
>>> row[2]
10
>>> row[3]
'Barry Warsaw'

Desempaquetando filas¶

Cuando disponemos de una fila como resultado de una consulta (ya sea en formato tupla o en formato sqlite3.Row) podemos realizar un desempaquetado para separar sus campos en variables únicas:

>>> sql = 'SELECT * FROM pyversions'
>>> result = cur.execute(sql)
>>> row = result.fetchone()

>>> row
<sqlite3.Row at 0x102e71ab0>

>>> branch, released_at_year, released_at_month, release_manager = row

>>> branch
'2.6'
>>> released_at_year
2008
>>> released_at_month
10
>>> release_manager
'Barry Warsaw'

Número de filas¶

Hay ocasiones en las que lo que necesitamos obtener no es el dato en sí mismo, sino el número de filas vinculadas a una determinada consulta. En este sentido hay varias alternativas.

La primera aproximación es utilizar herramientas Python para obtener la longitud del resultado de la consulta:

>>> result = cur.execute('SELECT * FROM pyversions')

>>> rows = result.fetchall()

>>> len(rows)
15

La segunda aproximación es mediante la sentencia SQL para contar: COUNT() y obtener su resultado:

>>> result = cur.execute('SELECT COUNT(*) FROM pyversions')

>>> rows = result.fetchone()

>>> rows[0]  # sólo hay una columna
15

Obviamente si lo único que necesitamos es obtener el número de filas afectadas, esta segunda opción a través de COUNT() tiene más sentido.

Comprobando si hay resultados¶

Hay ocasiones en las que necesitamos comprobar si la consulta tiene algún registro.

Una manera de enfocar este escenario es utilizando el operador morsa teniendo en cuenta que fetchone() devuelve None si la consulta es vacía. Veamos su implementación:

>>> con = sqlite3.connect(db_path)
>>> cur = con.cursor()

>>> # Consulta vacía
>>> res = cur.execute('SELECT * FROM pyversions WHERE branch=4.0')

>>> if row := res.fetchone():
...     print(row)
... else:
...     print('Empty query')
...
Empty query

>>> # Consulta con datos
>>> res = cur.execute('SELECT * FROM pyversions WHERE branch=3.0')

>>> if row := res.fetchone():
...     print(row)
... else:
...     print('Empty query')
...
('3.0', 2008, 12, 'Barry Warsaw')

Otras funcionalidades¶

Tablas en memoria¶

Existe la posibilidad de trabajar con tablas en memoria sin necesidad de tener un fichero en disco.

Veamos un ejemplo muy sencillo:

>>> con = sqlite3.connect(':memory:')

>>> cur = con.cursor()

>>> sql = 'CREATE TABLE temp (id INTEGER PRIMARY KEY, value TEXT)'
>>> cur.execute(sql)
<sqlite3.Cursor at 0x107884ea0>

>>> sql = 'INSERT INTO temp VALUES (1, "X")'
>>> cur.execute(sql)
<sqlite3.Cursor at 0x107884ea0>

>>> for row in cur.execute('SELECT * FROM temp'):
...     print(row)
...
(1, 'X')

Prudencia

Obviamente si no guardamos estos datos los perderemos al no disponer de persistencia.

Claves autoincrementales¶

Es muy habitual encontrar en la definición de una tabla un campo identificador numérico entero que actúe como clave primaria y se le asignen valores automáticamente.

Existe una forma sencilla de aplicar este escenario en SQLite:

Definimos una columna de tipo INTEGER PRIMARY KEY.
En cualquier operación de inserción, si no especificamos un valor explícito para dicha columna, se rellenará automáticamente con un entero sin usar, típicamente uno más que el último valor generado.

Veamos un ejemplo de aplicación con una tabla en memoria que almacena ciudades y sus geolocalizaciones:

>>> con = sqlite3.connect(':memory:')
>>> cur = con.cursor()

>>> cur.execute("""CREATE TABLE cities (
... id INTEGER PRIMARY KEY,
... city TEXT UNIQUE,
... latitude REAL,
... longitude REAL)""")
<sqlite3.Cursor at 0x107139bc0>

>>> cur.execute("""INSERT INTO
... cities (city, latitude, longitude)  # Obviamos "id"
... VALUES ("Tokyo", 35.652832, 139.839478)""")
<sqlite3.Cursor at 0x107139bc0>

>>> result = cur.execute('SELECT * FROM cities')
>>> result.fetchall()
[(1, 'Tokyo', 35.652832, 139.839478)]

>>> cur.execute("""INSERT INTO
... cities (city, latitude, longitude)  # Obviamos "id"
... VALUES ("Barcelona", 41.390205, 2.154007)""")
<sqlite3.Cursor at 0x107139bc0>

>>> result = cur.execute('SELECT * FROM cities')
>>> result.fetchall()
[(1, 'Tokyo', 35.652832, 139.839478), (2, 'Barcelona', 41.390205, 2.154007)]

Importante

Si la clave primaria de una tabla es una columna de tipo INTEGER ésta se convierte en un alias para rowid.

Copias de seguridad¶

Es posible realizar copias de seguridad de manera programática 3:

>>> def progress(status, remaining, total):
...     print(f'Copied {total-remaining} of {total} pages...')
...

>>> src = sqlite3.connect('python.db')
>>> dst = sqlite3.connect('backup.db')

>>> with dst:
...     src.backup(dst, pages=1, progress=progress)
...
Copied 1 of 3 pages...
Copied 2 of 3 pages...
Copied 3 of 3 pages...

>>> dst.close()
>>> src.close()

Podemos comprobar que ambas bases de datos tienen el mismo contenido:

>>> src = sqlite3.connect('python.db')
>>> dst = sqlite3.connect('backup.db')

>>> with src, dst:
...     src_cur = src.cursor()
...     dst_cur = dst.cursor()
...     sql = 'SELECT * FROM pyversions'
...     src_data = src_cur.execute(sql).fetchall()
...     dst_data = dst_cur.execute(sql).fetchall()
...     if src_data == dst_data:
...         print('Contents from both DBs are the same!')
...
Contents from both DBs are the same!

Un par de incisos respecto a este mecanismo:

Funciona incluso si la base de datos está siendo accedida por otros clientes o concurrentemente por la misma conexión.
Funciona incluso entre bases de datos :memory: y bases de datos en disco.

Ver también

Hacer directamente una copia del fichero file.db (desde el propio sistema operativo) también es una opción rápida para disponer de copias de seguridad.

Información de filas¶

Cuando ejecutamos una sentencia de modificación sobre la base de datos podemos obtener el número de filas modificadas.

Este dato lo sacamos del atributo rowcount del cursor. Veamos un ejemplo:

>>> con = sqlite3.connect('python.db')
>>> cur = con.cursor()

>>> cur.execute('SELECT * FROM pyversions').fetchall()
[('2.6', 2008, 10, 'Barry Warsaw'),
 ('2.7', 2010, 7, 'Benjamin Peterson'),
 ('3.0', 2008, 12, 'Barry Warsaw'),
 ('3.1', 2009, 6, 'Benjamin Peterson'),
 ('3.2', 2011, 2, 'Georg Brandl'),
 ('3.3', 2012, 9, 'Georg Brandl'),
 ('3.4', 2014, 3, 'Larry Hastings'),
 ('3.5', 2015, 9, 'Larry Hastings'),
 ('3.6', 2016, 12, 'Ned Deily'),
 ('3.7', 2018, 6, 'Ned Deily'),
 ('3.8', 2019, 10, 'Łukasz Langa'),
 ('3.9', 2020, 10, 'Łukasz Langa'),
 ('3.10', 2021, 10, 'Pablo Galindo Salgado'),
 ('3.11', 2022, 10, 'Pablo Galindo Salgado'),
 ('3.12', 2023, 10, 'Thomas Wouters'),
 ('3.13', 2024, 10, 'Thomas Wouters')]

>>> cur.execute('UPDATE pyversions SET released_at_year=2000')
<sqlite3.Cursor at 0x105593dc0>

>>> cur.rowcount
16  # filas modificadas

Igualmente cuando insertamos un registro en la base de datos podemos obtener cuál es el identificador de la últila fila insertada:

>>> cur.execute('INSERT INTO pyversions VALUES ("3.14", 2025, 10, "Guido Van Rossum")')
<sqlite3.Cursor at 0x105593dc0>

>>> cur.lastrowid
17

Ejecución de scripts¶

¿Qué pasaría si intentamos ejecutar varias sentencias SQL a la vez con las herramientas que hemos visto hasta ahora?

Supongamos una tabla de ejemplo que mantiene estadísticas de los mejores jugadores históricos de la NBA. Queremos crear la tabla e insertar 3 registros en una misma ejecución:

>>> con = sqlite3.connect(':memory:')

>>> cur = con.cursor()

>>> sql = """
... CREATE TABLE nba (
...     player TEXT PRIMARY KEY,
...     points INTEGER
... );
... INSERT INTO nba VALUES ('LeBron James', 8023);
... INSERT INTO nba VALUES ('Michael Jordan', 5987);
... INSERT INTO nba VALUES ('Kareem Abdul-Jabbar', 5762);
... """

>>> cur.execute(sql)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ProgrammingError: You can only execute one statement at a time.

Obtenemos un error indicando que sólo se puede ejecutar una sentencia cada vez.

Para resolver este problema disponemos de la función executescript() que permite ejecutar varias sentencias SQL de una sola vez:

>>> cur.executescript(sql)
<sqlite3.Cursor at 0x1028ce840>

Aparentemente ahora sí que ha ido todo bien. Podemos comprobar que la tabla está creada y los registros insertados:

>>> sql = 'SELECT * FROM nba'
>>> res = cur.execute(sql)

>>> res.fetchall()
[('LeBron James', 8023),
 ('Michael Jordan', 5987),
 ('Kareem Abdul-Jabbar', 5762)]

EJERCICIOS DE REPASO

Escriba una clase ToDo y una clase Task que permita implementar una aplicación de gestión de tareas.

Plantilla: todo.py
Tests: test_todo.py
Lanzar tests: pytest -xq test_todo.py

Escriba una clase Twitter junto a dos clases User y Tweet que permita implementar una aplicación de tipo «Twitter».

Plantilla: twitter.py
Tests: test_twitter.py
Lanzar tests: pytest -xq test_twitter.py

1: Foto original de portada por Jandira Sonnendeck en Unsplash.
2: Herramienta cliente de sqlite para terminal.
3: Ejemplo tomado de la documentación oficial de Python.
4: Inyección SQL es un método de infiltración de código intruso que se vale de una vulnerabilidad informática presente en una aplicación en el nivel de validación de las entradas para realizar operaciones sobre una base de datos.