# 1. Comandos Básicos


## Introducción

Este taller está diseñado para que los estudiantes desarrollen sus habilidades en la realización de consultas SQL sobre la base de datos "world database", un conjunto de datos realista y ampliamente utilizado para aprender sobre bases de datos relacionales. En este taller, el estudiante aprenderá a realizar consultas básicas y de nivel medio empleando operadores SQL y notación de álgebra relacional para construir y entender mejor las consultas, fortaleciendo el conocimiento de comandos como `HAVING`, `GROUP BY`, `AVERAGE`, `COUNT`, `ORDER BY`, `LIKE`, `DISTINCT`, `BETWEEN`, `MAX`, `MIN`, y `AS`, entre otros.

Las consultas se dividen en dos niveles de dificultad: **básico**, que introduce a los conceptos fundamentales de las consultas SQL, y **medio**, que desafía a los estudiantes a utilizar operadores de agrupamiento, proyecciones, y condiciones más complejas para extraer y manipular datos. El objetivo es que el estudiante aprenda a traducir problemas de consulta de álgebra relacional a SQL de manera fluida y comprenda cómo aplicar los operadores más importantes de SQL para la manipulación y el análisis de datos en bases de datos relacionales.


:::{important}
Para este taller utilizaremos la base de datos World que ya tienen desde la instalación o pueden descargar desde [Other MySQL Documentation](https://dev.mysql.com/doc/index-other.html).
:::

In [1]:
mysql://root:123456@127.0.0.1:3306/world

## Base de Datos (world)

In [122]:
SHOW Tables;

Unnamed: 0,Tables_in_world
0,city
1,country
2,countrylanguage


### Tablas

#### Country

In [123]:
SELECT * FROM country;

Unnamed: 0,Code,Name,Continent,Region,SurfaceArea,IndepYear,Population,LifeExpectancy,GNP,GNPOld,LocalName,GovernmentForm,HeadOfState,Capital,Code2
0,ABW,Aruba,North America,Caribbean,193.0,,103000,78.4,828.0,793.0,Aruba,Nonmetropolitan Territory of The Netherlands,Beatrix,129.0,AW
1,AFG,Afghanistan,Asia,Southern and Central Asia,652090.0,1919.0,22720000,45.9,5976.0,,Afganistan/Afqanestan,Islamic Emirate,Mohammad Omar,1.0,AF
2,AGO,Angola,Africa,Central Africa,1246700.0,1975.0,12878000,38.3,6648.0,7984.0,Angola,Republic,José Eduardo dos Santos,56.0,AO
3,AIA,Anguilla,North America,Caribbean,96.0,,8000,76.1,63.2,,Anguilla,Dependent Territory of the UK,Elisabeth II,62.0,AI
4,ALB,Albania,Europe,Southern Europe,28748.0,1912.0,3401200,71.6,3205.0,2500.0,Shqipëria,Republic,Rexhep Mejdani,34.0,AL
5,AND,Andorra,Europe,Southern Europe,468.0,1278.0,78000,83.5,1630.0,,Andorra,Parliamentary Coprincipality,,55.0,AD
6,ANT,Netherlands Antilles,North America,Caribbean,800.0,,217000,74.7,1941.0,,Nederlandse Antillen,Nonmetropolitan Territory of The Netherlands,Beatrix,33.0,AN
7,ARE,United Arab Emirates,Asia,Middle East,83600.0,1971.0,2441000,74.1,37966.0,36846.0,Al-Imarat al-´Arabiya al-Muttahida,Emirate Federation,Zayid bin Sultan al-Nahayan,65.0,AE
8,ARG,Argentina,South America,South America,2780400.0,1816.0,37032000,75.1,340238.0,323310.0,Argentina,Federal Republic,Fernando de la Rúa,69.0,AR
9,ARM,Armenia,Asia,Middle East,29800.0,1991.0,3520000,66.4,1813.0,1627.0,Hajastan,Republic,Robert Kotšarjan,126.0,AM


#### City

In [124]:
SELECT * FROM city;

Unnamed: 0,ID,Name,CountryCode,District,Population
0,1,Kabul,AFG,Kabol,1780000
1,2,Qandahar,AFG,Qandahar,237500
2,3,Herat,AFG,Herat,186800
3,4,Mazar-e-Sharif,AFG,Balkh,127800
4,5,Amsterdam,NLD,Noord-Holland,731200
5,6,Rotterdam,NLD,Zuid-Holland,593321
6,7,Haag,NLD,Zuid-Holland,440900
7,8,Utrecht,NLD,Utrecht,234323
8,9,Eindhoven,NLD,Noord-Brabant,201843
9,10,Tilburg,NLD,Noord-Brabant,193238


#### CountryLanguage

In [125]:
SELECT * FROM countrylanguage;

Unnamed: 0,CountryCode,Language,IsOfficial,Percentage
0,ABW,Dutch,T,5.3
1,ABW,English,F,9.5
2,ABW,Papiamento,F,76.7
3,ABW,Spanish,F,7.4
4,AFG,Balochi,F,0.9
5,AFG,Dari,T,32.1
6,AFG,Pashto,T,52.4
7,AFG,Turkmenian,F,1.9
8,AFG,Uzbek,F,8.8
9,AGO,Ambo,F,2.4


## Consultas Básicas

**1. Selección de países en el continente 'Asia'**

**Álgebra relacional**:

$$
\sigma_{\text{Continent} = 'Asia'}(\text{Country})
$$

**SQL equivalente**:

In [None]:
SELECT Name FROM country WHERE Continent="Asia";

Unnamed: 0,Name
0,Afghanistan
1,United Arab Emirates
2,Armenia
3,Azerbaijan
4,Bangladesh
5,Bahrain
6,Brunei
7,Bhutan
8,China
9,Cyprus


**2. Contar el número total de ciudades**

**Álgebra relacional**:  

$$
\text{COUNT}(\text{City})
$$

**SQL equivalente**:  

In [127]:
SELECT DISTINCT COUNT(Name) AS Total_Cities FROM city;

Unnamed: 0,Total_Cities
0,4079


**3. Listar todos los idiomas únicos en la tabla CountryLanguage**

**Álgebra relacional**:  

$$
\pi_{\text{Language}}(\text{CountryLanguage})
$$

**SQL equivalente**:  

In [None]:
SELECT DISTINCT Language FROM countrylanguage ORDER BY Language ASC;

Unnamed: 0,Language
0,[South]Mande
1,Abhyasi
2,Acholi
3,Adja
4,Afar
5,Afrikaans
6,Aimará
7,Ainu
8,Aizo
9,Akan


**4. Selección de países con población mayor a 100 millones**

**Álgebra relacional**:  

$$
\sigma_{\text{Population} >  100000000 }(\text{Country})
$$

**SQL equivalente**:  

In [129]:
SELECT Name,Population  FROM country 
WHERE Population>100e6
ORDER BY Population DESC;

Unnamed: 0,Name,Population
0,China,1277558000
1,India,1013662000
2,United States,278357000
3,Indonesia,212107000
4,Brazil,170115000
5,Pakistan,156483000
6,Russian Federation,146934000
7,Bangladesh,129155000
8,Japan,126714000
9,Nigeria,111506000


**5. Listar nombres de países y continentes ordenados alfabéticamente por nombre de país**

**Álgebra relacional**:  

$$
\pi_{\text{Name}, \text{Continent}}(\text{Country}) \text{ ORDER BY Name}
$$
**SQL equivalente**:  

In [130]:
SELECT Name, Continent FROM country 
ORDER BY Name ASC;

Unnamed: 0,Name,Continent
0,Afghanistan,Asia
1,Albania,Europe
2,Algeria,Africa
3,American Samoa,Oceania
4,Andorra,Europe
5,Angola,Africa
6,Anguilla,North America
7,Antarctica,Antarctica
8,Antigua and Barbuda,North America
9,Argentina,South America



**6. Obtener la ciudad con mayor población**

**Álgebra relacional**:  

$$
\text{MAX}(\pi_{\text{Population}}(\text{City}))
$$

**SQL equivalente**:  

In [131]:
SELECT Name, Population FROM city 
ORDER BY Population DESC LIMIT 1;
-- otra opción usando MAX()
SELECT Name, Population FROM city
WHERE Population=(SELECT MAX(Population) FROM city);

Unnamed: 0,Name,Population
0,Mumbai (Bombay),10500000


**7. Selección de países que tienen 'Republic' en su nombre**

**Álgebra relacional**:  

$$
\sigma_{\text{Name LIKE '\%Republic\%'}}(\text{Country})
$$

**SQL equivalente**:  

In [132]:
SELECT Name FROM country 
WHERE Name LIKE "%%Republic%%";

Unnamed: 0,Name
0,Central African Republic
1,"Congo, The Democratic Republic of the"
2,Czech Republic
3,Dominican Republic


**8. Listar los 5 países más poblados**

**Álgebra relacional**:  

$$
\pi_{\text{Name, Population}}(\text{Country}) \text{ ORDER BY Population DESC LIMIT 5}
$$

**SQL equivalente**:  


In [133]:
SELECT Name,Population FROM country
ORDER BY Population DESC LIMIT 5;

Unnamed: 0,Name,Population
0,China,1277558000
1,India,1013662000
2,United States,278357000
3,Indonesia,212107000
4,Brazil,170115000


**9. Calcular la población promedio de los países en el continente 'Europe'**

**Álgebra relacional**:  

$$
\text{AVG}(\pi_{\text{Population}}(\sigma_{\text{Continent} = 'Europe'}(\text{Country})))
$$

**SQL equivalente**:  


In [None]:
SELECT AVG(Population) AS AVG_Poblacion_Europa
FROM country WHERE Continent="Europe";

Unnamed: 0,AVG_Poblacion_Europa
0,15871190.0


**10. Selección de idiomas con más del 10% de la población mundial que los habla**

**Álgebra relacional**:  

$$
\sigma_{\text{Percentage} > 10}(\text{CountryLanguage})
$$

**SQL equivalente**:  


In [135]:
SELECT Language, SUM(Population * (Percentage / 100)) AS TotalSpeakers
FROM country
JOIN countrylanguage ON country.Code = countrylanguage.CountryCode
GROUP BY Language
HAVING TotalSpeakers > (SELECT SUM(Population) FROM country) * 0.1
ORDER BY TotalSpeakers DESC;

Unnamed: 0,Language,TotalSpeakers
0,Chinese,1191844000.0


## Consultas de Nivel Medio


**1. Encontrar los 5 países más poblados por continente**

**Álgebra relacional**:  

$$
\pi_{\text{Name, Population}}(\text{Country}) \text{ GROUP BY Continent ORDER BY Population DESC LIMIT 5}
$$

**SQL equivalente**:  


In [136]:
SELECT Continent, Name  AS Country, Population
FROM country c1
WHERE (
    SELECT COUNT(*)
    FROM country c2
    WHERE c2.Continent = c1.Continent
      AND c2.Population > c1.Population
) < 5
ORDER BY Continent, Population DESC;
-- otra forma usando ROW_NUMBER
SELECT Continent, Name AS Country, Population
FROM (
    SELECT Continent, Name, Population,
           ROW_NUMBER() OVER (PARTITION BY Continent ORDER BY Population DESC) AS rn
    FROM country
) AS ranked
WHERE rn <= 5
ORDER BY Continent, Population DESC;


Unnamed: 0,Continent,Country,Population
0,Asia,China,1277558000
1,Asia,India,1013662000
2,Asia,Indonesia,212107000
3,Asia,Pakistan,156483000
4,Asia,Bangladesh,129155000
5,Europe,Russian Federation,146934000
6,Europe,Germany,82164700
7,Europe,United Kingdom,59623400
8,Europe,France,59225700
9,Europe,Italy,57680000


**2. Listar países que usan más de un idioma**

**Álgebra relacional**:  

$$
\sigma_{\text{count(Language)} > 1}(\text{CountryLanguage GROUP BY CountryCode})
$$

**SQL equivalente**:  


In [137]:
SELECT Name, CountryCode, COUNT(Language) AS NoLanguages FROM countrylanguage 
LEFT JOIN country on countrylanguage.CountryCode = country.Code
GROUP BY CountryCode HAVING COUNT(Language)>1;


Unnamed: 0,Name,CountryCode,NoLanguages
0,Aruba,ABW,4
1,Afghanistan,AFG,5
2,Angola,AGO,9
3,Albania,ALB,3
4,Andorra,AND,4
5,Netherlands Antilles,ANT,3
6,United Arab Emirates,ARE,2
7,Argentina,ARG,3
8,Armenia,ARM,2
9,American Samoa,ASM,3


**3. Calcular el total de población de cada continente**

**Álgebra relacional**:  

$$
\pi_{\text{Continent}, \text{SUM(Population)}}(\text{Country}) \text{ GROUP BY Continent}
$$

**SQL equivalente**:  


In [138]:
SELECT Continent, SUM(Population) AS TotalPoblacion
FROM country 
GROUP BY Continent ORDER BY Continent ASC;

Unnamed: 0,Continent,TotalPoblacion
0,Asia,3705026000.0
1,Europe,730074600.0
2,North America,482993000.0
3,Africa,784475000.0
4,Oceania,30401150.0
5,Antarctica,0.0
6,South America,345780000.0


**4. Contar el número de ciudades en cada país**

**Álgebra relacional**:  

$$
\pi_{\text{CountryCode}, \text{COUNT(*)}}(\text{City}) \text{ GROUP BY CountryCode}
$$

**SQL equivalente**:  

In [139]:
SELECT country.Name, CountryCode, COUNT(*) AS NoCities 
FROM city 
LEFT JOIN country ON city.CountryCode = country.Code 
GROUP BY CountryCode ORDER BY NoCities ASC;

Unnamed: 0,Name,CountryCode,NoCities
0,Aruba,ABW,1
1,Albania,ALB,1
2,Andorra,AND,1
3,Netherlands Antilles,ANT,1
4,Antigua and Barbuda,ATG,1
5,Burundi,BDI,1
6,Bahrain,BHR,1
7,Bahamas,BHS,1
8,Barbados,BRB,1
9,Brunei,BRN,1


**5. Listar los países y su promedio de vida ordenados por el promedio de vida en orden descendente**

**Álgebra relacional**:  

$$
\pi_{\text{Name}, \text{LifeExpectancy}}(\text{Country}) \text{ ORDER BY LifeExpectancy DESC}
$$

**SQL equivalente**:  


In [140]:
SELECT Name, LifeExpectancy FROM country
ORDER BY LifeExpectancy DESC;

Unnamed: 0,Name,LifeExpectancy
0,Andorra,83.5
1,Macao,81.6
2,San Marino,81.1
3,Japan,80.7
4,Singapore,80.1
5,Australia,79.8
6,Switzerland,79.6
7,Sweden,79.6
8,Hong Kong,79.5
9,Canada,79.4


**6. Selección de ciudades cuya población está entre 500,000 y 1,000,000**

**Álgebra relacional**:  

$$
\sigma_{500000 \leq \text{Population} \leq 1000000}(\text{City})
$$

**SQL equivalente**:  

In [141]:
SELECT Name, Population FROM city
WHERE Population BETWEEN 500000 AND 1000000
ORDER BY Name;

Unnamed: 0,Name,Population
0,Acapulco de Juárez,721011
1,Adelaide,978100
2,Agra,891790
3,Aguascalientes,643360
4,Ahvaz,804980
5,Allahabad,792858
6,Almirante Brown,538918
7,Amman,1000000
8,Amoy [Xiamen],627500
9,Amritsar,708835


**7. Listar los idiomas hablados en países donde la población es mayor a 50 millones**

**Álgebra relacional**:  

$$
\pi_{\text{Language}}(\sigma_{\text{Population} > 50000000}(\text{Country}) \bowtie \text{CountryLanguage})
$$

**SQL equivalente**:  

In [142]:
SELECT DISTINCT Language, Name FROM countrylanguage 
JOIN country ON countrylanguage.CountryCode=country.Code
WHERE Population>5e6;

Unnamed: 0,Language,Name
0,Balochi,Afghanistan
1,Dari,Afghanistan
2,Pashto,Afghanistan
3,Turkmenian,Afghanistan
4,Uzbek,Afghanistan
5,Ambo,Angola
6,Chokwe,Angola
7,Kongo,Angola
8,Luchazi,Angola
9,Luimbe-nganguela,Angola


**8. Calcular el promedio de población por ciudad en cada país**

**Álgebra relacional**:  

$$
\pi_{\text{CountryCode}, \text{AVG(Population)}}(\text{City}) \text{ GROUP BY CountryCode}
$$

**SQL equivalente**:  

In [143]:
SELECT country.Name, AVG(city.Population)
FROM city 
JOIN country ON city.CountryCode=country.Code
GROUP BY country.Name;

Unnamed: 0,Name,AVG(city.Population)
0,Afghanistan,583025.0
1,Netherlands,185001.8
2,Netherlands Antilles,2345.0
3,Albania,270000.0
4,Algeria,288454.4
5,American Samoa,3761.5
6,Andorra,21189.0
7,Angola,512320.0
8,Anguilla,778.0
9,Antigua and Barbuda,24000.0


**9. Seleccionar los países cuya calificación de vida está por encima del promedio mundial**

**Álgebra relacional**:  

$$
\sigma_{\text{LifeExpectancy} > \text{AVG(LifeExpectancy)}}(\text{Country})
$$

**SQL equivalente**:  

In [144]:
SELECT Name, LifeExpectancy FROM country 
WHERE LifeExpectancy>(SELECT AVG(LifeExpectancy) AS WorldAVGLE FROM country)
ORDER BY LifeExpectancy ASC;

Unnamed: 0,Name,LifeExpectancy
0,Iraq,66.5
1,Russian Federation,67.2
2,Mongolia,67.3
3,Philippines,67.5
4,Saudi Arabia,67.8
5,Fiji Islands,67.9
6,Tonga,67.9
7,Belarus,68.0
8,Indonesia,68.0
9,Trinidad and Tobago,68.0


**10. Encontrar los continentes con una calificación de vida superior al promedio de su continente**

**Álgebra relacional**:  

$$
\pi_{\text{Continent, AVG(LifeExpectancy)}}(\text{Country}) \text{ GROUP BY Continent}
$$

**SQL equivalente**:  


In [145]:
-- Muestra el promedio de la expectativa de vida por continente
SELECT Continent, AVG(LifeExpectancy) FROM country
GROUP BY Continent;

-- Responde la pregunta
SELECT Continent, Name, LifeExpectancy
FROM country
WHERE LifeExpectancy > (
    SELECT AVG(LifeExpectancy)
    FROM country AS sub_country
    WHERE sub_country.Continent = country.Continent
)
ORDER BY Continent, LifeExpectancy ASC;

Unnamed: 0,Continent,Name,LifeExpectancy
0,Asia,Philippines,67.5
1,Asia,Saudi Arabia,67.8
2,Asia,Indonesia,68.0
3,Asia,Syria,68.5
4,Asia,Thailand,68.6
5,Asia,Vietnam,69.3
6,Asia,Iran,69.7
7,Asia,North Korea,70.7
8,Asia,Malaysia,70.8
9,Asia,Turkey,71.0


## Más Consultas

Propongan 10 preguntas, con su respectiva representación en el álgebra relacional, que puedan ser resueltas con consultas a la base de datos **World**. Deben proponer la pregunta y responderla utilizando comandos de MySQL.

### Plantilla

Utilicen la siguiente plantilla para la creación de cada pregunta:

#### No. Enunciado Pregunta

#### Álgebra relacional

$$
Álgebra Relacional
$$

#### SQL equivalente
```sql
-- Consulta en comandos de MySQL
```

## Ejercicio

::::{admonition} Taller 

Realizar todo el taller. Debe presentarse como un archivo de markdown que utilice los bloques de código y de matemáticas. 

**Entregables:**

Deben entregar un archivo tipo markdown con las respuestas de las preguntas escritas en MySQL, puede llamarse `consultas.md`. En este también deben colocar los pantallazos de los resultados, para ello en la misma carpeta donde esta el archivo creen una carpeta de `imagenes` y guardan alli todos los pantallazos. Para llamarlas dentro del archivo markdown usen el comando:

```html
<div align="center">
  <img src="./images/nombre_imagen" width=90%>
</div>
```

:::{tip}
:class: dropdown
Utilicen este archivo como plantilla para la solución.
:::
:::: 

## Conclusiones

1. **Comprensión de Operadores y Sintaxis SQL**: Al finalizar el taller, los estudiantes habrán desarrollado una comprensión sólida de los operadores básicos y de nivel medio en SQL y podrán utilizar comandos como `GROUP BY`, `HAVING`, `LIKE`, `DISTINCT`, y operadores de agregación (`MAX`, `MIN`, `AVG`, `COUNT`) en diversas situaciones.

2. **Uso de Álgebra Relacional como Fundamento Teórico**: La introducción de la notación de álgebra relacional proporciona a los estudiantes una base teórica fundamental, permitiéndoles visualizar mejor las operaciones y comprender la traducción de conceptos abstractos a sintaxis SQL práctica.

3. **Capacidad para Resolver Consultas Complejas**: Gracias a las consultas de nivel medio, los estudiantes adquieren habilidades para resolver problemas más complejos en SQL, como agrupamiento y filtrado de datos en base a condiciones específicas. Esta habilidad es esencial para el análisis y manejo de grandes volúmenes de datos en aplicaciones del mundo real.

4. **Preparación para Escenarios Reales**: El uso de una base de datos con información global permite a los estudiantes visualizar cómo los datos interrelacionados pueden ser consultados y organizados, lo cual es útil en aplicaciones como reportes, visualización de datos, y en el contexto de decisiones empresariales.

## Referencias

### Libros 
- Elmasri, R., & Navathe, S. B. (2015). *Fundamentals of Database Systems* (7th ed.). Pearson.
- Murach, J. (2017). *Murach's MySQL*. Mike Murach & Associates, Inc.
- Ramakrishnan, R., & Gehrke, J. (2003). *Database Management Systems* (3rd ed.). McGraw-Hill.

### Bases de Datos
- [world.db](https://github.com/openmundi/world.db)
- [world.db ](https://openmundi.github.io/)

### Documentación

- [Chapter 7 Examples of Common Queries](https://dev.mysql.com/doc/mysql-tutorial-excerpt/5.7/en/examples.html)
- [MySQL GROUP BY Statement ](https://www.w3schools.com/mysql/mysql_groupby.asp)
- [MySQL SQL](https://www.w3schools.com/mysql/mysql_sql.asp)
- W3Schools. (n.d.). *SQL Tutorial*. Retrieved from [W3Schools SQL Tutorial](https://www.w3schools.com/sql/)

