# Trabajo práctico Nº5: Vía Láctea: cúmulos estelares

## Ayuda para realizar la práctica con python

Notebook creada por Tomás Ansin (2021) y modificada por G. Ferrero (2022, 2023)


In [None]:
# %matplotlib widget
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
plt.style.use('../sisest.mplstyle')

#### 1. Descargue del Classroom la tabla del catálogo de Cúmulos Globulares (CG) de W. E. Harris (1996, AJ, 112, 1487), edición 2010. La tabla contiene las posiciones de los CG y la abundancia de hierro de cada uno. 

#### Recuerde que las coordenadas X,Y,Z de cada CG están dadas en un sistema rectangular centrado en el Sol, cuyo eje X apunta al centro galáctico y cuyo eje Y apunta en la dirección del movimiento solar (l = 90°).

##### a) Grafique (en 3D) las posiciones de todos los CG que se encuentren dentro de un cubo de 40 kpc de lado, centrado en el Sol. Señale la posición del Sol y del plano galáctico. ¿Qué información puede extraer a través de la inspección visual de este gráfico acerca de la distribución espacial de los CG?
   
##### Incluya en el informe los gráficos de las proyecciones de los cúmulos antes mencionados sobre los planos $(X,Y)$ y $(X.Z)$. Tómelos en cuenta en su argumentación.
   
##### Nota: recuerde mantener la misma escala en abscisas y ordenadas en estos gráficos.

Se recomienda comenzar abriendo el archivo de datos para observar su estructura con un editor  También se puede hacer con el comando del sistema 

!head Harris2010.csv

Importamos los datos con pandas. Notemos que su estructura es *separado por comas*, como lo indica el sufijo del nombre del archivo. Pero el separador usado es *punto y coma* (**;**). Saltamos las líneas comentarizadas, que empiezan con **#**.


In [None]:

harris = pd.read_csv('nombre_archivo_datos.csv', sep = ';', comment='#')

# Observamos las primeras líneas para ver si se importó correctamente

harris.head()


#### A continuación tenemos un ejemplo de cómo construir un gráfico 3D.  

In [None]:
# primero generamos tres arreglos con datos artificiales que serán las coordenadas 
# de los puntos que vamos a graficar. Luego tendremos que sustituir estos arreglos por las 
# coordenadas de los CG.

X = np.random.normal(10, 50, 200)
Y = np.random.normal(10, 50, 200)
Z = np.random.normal(10, 50, 200)

fig = plt.figure(figsize = (8,6))

# usamos add_subplot para tener la opción de una visualización en 3D

ax = fig.add_subplot(projection='3d') 

# y a continuación definimos qué arreglo nos da las coordenadas de cada punto a graficar.

ax.scatter(xs = X, ys = Y, zs = Z, zdir = 'z', c = 'k')

# configuramos los rangos de los ejes adecuadamente

ax.set_xlim(-100, 100) 
ax.set_ylim(-100, 100)
ax.set_zlim(-100, 100)

# con el siguiente comando, cambiando False por True, podemos ver una grilla superpuesta 
# a los datos

ax.grid(False)

# si queremos agregar un punto en algún lugar, como por ejemplo para indicar la posición 
# del sol o del centro galáctico, podemos usar el comando scatter. Así como está escrito
# agrega un punto, pero se puede poner otro marcador. la "s = " indica el tamaño (size).

ax.scatter(xs = -10, ys = 15, zs = 8, c = 'C3', s = 40)  

# Podemos agregar también un plano dibujado como una grilla. Para eso, primero
# creamos arreglos con puntos equiespaciados.

x = np.linspace(-100,100,10)
y = np.linspace(-100, 100,10)

# Luego, usando meshgrid, creamos la grilla.

Xp,Yp = np.meshgrid(x,y)

# y creamos también un arreglo con valores para el eje z, que serán todos ceros

Zp = 0 * Xp * Yp

# el siguiente comando convierte la grilla de puntos en una grilla de "alambres" y la grafica.

ax.plot_wireframe(Xp,Yp,Zp, alpha = 0.3)  

# para poner etiquetas a los ejes usamos este comando

ax.set_xlabel('etiqueta_eje_x')
ax.set_ylabel('etiqueta_eje_y')
ax.set_zlabel('etiqueta_eje_z')

# Se puede cambiar el punto de vista para ver el gráfico en diferentes perspectivas.

ax.azim = -50 # rotación en eje principal
#ax.dist = 7   # distancia del punto de vista al gráfico
ax.elev = 20  # elevación del punto de vista respecto al plano principal

plt.show()

##### Cuando hay que seleccionar un grupo de cúmulos usando como criterio que las coordenadas estén en ciertos rangos, se puede hacer lo que sigue. Obviamente, hay que darles valores adecuados a los límites inferior y superior.

In [None]:
harris40 = harris[(harris.X < limite_superior) & (harris.X > limite_inferior) 
                & (harris.Y < limite_superior) & (harris.Y > limite_inferior) 
                & (harris.Z < limite_superior) & (harris.Z > limite_inferior)]
harris40.describe()

In [None]:
# Los gráficos con las proyecciones de los CG sobre los planos coordenados se pueden hacer 
# usando plt.scatter
# Por ejemplo:

fig = plt.figure(figsize=(4,4))

plt.scatter(#arreglo_eje_horizontal, #arreglo_eje_vertical, #arreglo_eje_vertical, 
    c = #color, s = #número_tamaño)                  

# PONER ATENCION EN CÓMO SE ORIENTAN LOS EJES 

# Para igualar las escalas en los dos ejes se puede usar este comando
    
plt.axis('square')


#### b) Obtenga un valor aproximado para la distancia del Sol al centro galáctico $(R_0)$ de la siguiente forma:
##### 1) Calcule los valores medios $<X_0>$, $<Y_0>$, $<Z_0>$ y las dispersiones1 $\sigma_X$ , $\sigma_Y$ y $\sigma_Z$ de las coordenadas $X, Y$ y $Z$.


In [None]:
# Esto se puede resolver utilizando los atributos de pandas que calculan los promedios y 
# las dispersiones de las columnas de un data frame. Por ejemplo:

X0m = harris.X.mean() # calcula el promedio de la columna X y lo guarda en una variable X0m

X0d = harris.X.std()  # calcula la desviación estándar de la columna X y la guarda 
                      # en una variable X0m


#### 2) Seleccione los cúmulos que tengan $|X - <X_0>| < 2\sigma_X$ , $|Y - <Y_0>| < 2\sigma_Y$ y $|Z - <Z_0>| < 2\sigma_X$ . Para esos cúmulos recalcule el valor medio de las coordenadas $<X_1>$, $<Z_1>$ y $<Z_1>$. En base a estos resultados, indique cuál serı́a la distancia más probable del Sol al centro Galáctico, ası́ como sus coordenadas $Y_C$ , $Z_C$ . Analice si los resultados obtenidos son compatibles con sus conocimientos acerca de la posición del centro galáctico.
##### Nota: en este paso es muy importante combinar correctamente las condiciones de selección en los tres ejes.

Aquí se puede definir una función que calcule el valor absoluto de la diferencia entre cada valor de una columna y el valor medio de la misma columna. 

Suponiendo que la columna en cuestión sea x y xm su valor medio. Se puede crear esta función:

In [None]:
def dist(x, xm):
    return abs(x-xm)

Luego, usando esa función seleccionamos los cúmulos que cumplen la condición pedida. Para eso, podemos seleccionar las líneas del dataframe *harris* que cumplan la condición y convertirlas en un "nuevo" dataframe. Por ejemplo

In [None]:

harris_sel = harris[(dist(harris.X, X0m)< 2 * X0d) & #... etc.

# hay que completar la condición.


#### c) Calcule y grafique un histograma de metalicidades para los CG de la Vı́a Láctea. Utilice intervalos de metalicidad $\Delta[Fe/H]$ = 0.1 dex, y centre el primer conteo en $[Fe/H]$ = −2.5. Elija luego un valor de $[Fe/H]$ que le permita separar las poblaciones de CG de alta y de baja metalicidad (“rojos” y “azules”).

Se pueden hacer histogramas con matplotlib de una manera bastante sencilla.

Para esta práctica conviene en primer lugar definir los bines, es decir, crear un arreglo que contenga los límites de las "cajas" (en valores de metalicidad) donde contamos los cúmulos.

La función arange de numpy es muy útil para esto. Lo veremos a continuación con datos falsos.

In [None]:
# primero vamos a crear un arreglo de 200 valores aleatorios entre -10 y 10 
# según  una distribución normal

datos = np.random.normal(0, 10, 200)  

# eso luego habrá que sustituirlo por las metalicidades de los CG

# crea valores equiespaciados comenzando en -10.5 y terminando en 10.5, con paso 1.0

bines = np.arange(-10.5, 10.5, 1.)    

# y ahora generamos el gráfico

fig = plt.figure()

# usamos la función hist (histograma) de matplotlib
# el argumento bins indica el los bordes de los bines
# el argumento align='mid' indica que las barras del histograma se centran 
# en el punto central de cada bin
# facecolor indica el color con el que se rellenan los bines

hist = plt.hist(datos, bins = bines, align = 'mid', edgecolor = 'C0', facecolor = 'b')

plt.xlabel('nombre_de_la_variable')
plt.ylabel('N')
plt.show()

In [None]:
# para separar los cúmulos según su metalicidad, conviene crear una columna que 
# indique si son azules o rojos. 
# Llenamos esa columna de acuerdo al valor numérico de la metalicidad.
# y con un "for" recorremos toda la columna metalicidad del dataframe.
# Si en la columna que creamos ponemos las palabras "blue" y "red" luego 
# podemos usar esas palabras para darle color a los puntos en los gráficos.
# Por ejemplo:

sep = #valor_de_separacion

harris['color'] = ['red' if metalicidad > sep else 'blue' 
                   for metalicidad in harris['FeH']]


#### d ) Repita los gráficos de la parte 1.a) pero seleccionando un cubo de 40 kpc de lado centrado en la posición del centro Galáctico calculado en 1.b). Distinga con sı́mbolos diferentes a los CG de acuerdo a las poblaciones identificadadas en 1.c). Señale la posición del Sol y del centro Galáctico. Describa las distribuciones espaciales de los CG en general y de cada una de las poblaciones.


Aquí lo único que tenemos que hacer es repetir los gráficos, pero poniendo el centro del cubo en las coordenadas del centro galáctico obtenidas antes.

#### 2. Descargue del Classroom la última versión del Catálogo de Cúmulos Abiertos Ópticamente Visibles de W. S. Dias et al. (2002, A&A, 387, 871) (archivo Dias2002 15comp.dat). Utilizando los datos del catálogo, haga lo siguiente:
##### a) Para todos los cúmulos con distancia al Sol conocida, calcule sus coordenadas $X, Y, Z$ en el mismo sistema rectangular ejercicio anterior. Grafique $X$ contra $Y$ , $Z$ contra $X$, y $Z$ contra $Y$ ; en los dos primeros gráficos, ubique la posición del centro Galáctico. Describa la distribución espacial observada de los cúmulos abiertos en la Galaxia y los efectos que pueden estar afectando a la distribución observada.

La tabla de Dias+2002 se puede cargar usando un comando análogo al de la tabla anterior.

Las coordenadas $X,Y,Z$ se pueden agregar como columnas nuevas en el dataframe generado al importar la de Dias+2002.



#### 2. b) Repita el gráfico $X$ contra $Y$, pero limitado a los cúmulos que se encuentren a una distancia de menos de 5 kpc  del Sol, tengan más de 10 miembros estimados, exista fotometría, no sean dudosos, ni posibles cúmulos globulares, ni posibles asterismos, ni objetos no encontrados en el Digital Sky Survey (DSS). Los mismos se encuentran en el archivo *Dias2002_15sel.dat*. 

#### Agrupe los cúmulos en los siguientes rangos de edades (haciendo un gráfico para cada grupo):
\begin{eqnarray}
 & \log (t) & \le 7.0 \\
 & \log (t) & \le 7.5  \\
7.5 < & \log (t) & \le 8.0 \\ 
8.0 < & \log (t) & \\
\end{eqnarray}
   
#### Describa las distribuciones espaciales que se obtienen; considere para ello la estructura de la Galaxia (ver figura *MW_map.jpg* en el Classroom) y las condiciones que deben cumplir los trazadores de la estructura espiral.

Aquí solamente se trata de importar la nueva tabla y graficar imponiendo las condiciones en la variable correspondiente (edad).

Para ayudar a identificar los brazos espirales, se pueden superponer las trazas que se encuentran en el archivo *curvagalaxia.txt*

#### 2. c) Calcule la distancia galactocéntrica $R$ de cada cúmulo abierto al centro galáctico y grafique las metalicidades en función de $R$. Use distintos símbolos y/o colores para los cúmulos con diferentes rangos de edades:
\begin{eqnarray}
       & \log (t) & \le 7.25 \\
7.25 < & \log (t) & \le 8.0 \\
8.0 <  & \log (t) & \le 9.0  \\
9.0 <  & \log (t) & \\
\end{eqnarray}
    
#### Describa este gráfico, tratando de relacionar la distribución espacial de los cúmulos abiertos con sus edades y    metalicidades.

La distancia R se puede introducir como una nueva columna en el dataframe con los datos seleccionados de la tabla de Dias+2002.

Luego se trata de graficar, imponiendo las condiciones correspondientes.
