# Trabajo práctico No. 4: Cúmulos globulares

Ayuda para los trabajos prácticos de Sistemas Estelares.

Notebook creada por Tomás Ansin (2021) y modificada por G. Ferrero (2022, 2023)

### **Distancia, metalicidad y edad de un cúmulo globular**

### Consulte la base de datos VizieR ([http://vizier.u-strasbg.fr/viz-bin/VizieR](http://vizier.u-strasbg.fr/viz-bin/VizieR)), y obtenga los datos fotométricos de las estrellas del cúmulo globular NGC 1261 [Kravtsov et al. 2010](http://adsabs.harvard.edu/abs/2010A\%26A...516A..23K). Busque en la base de datos [NED](http://ned.ipac.caltech.edu) los valores de las absorciones en las bandas fotométricas presentes en la tabla.


Para encontrar la tabla, es suficiente indicarle a VizieR en el campo Find catalogs among... (el primero de arriba en el cuadro de fondo gris), el nombre del autor Kravtsov y en el campo Search by position... poner NGC 1261. Luego Find catalogs. Eso debería llevarlos al catálogo titulado UBVI Photometry of NGC 1261 (Kravtsov+, 2010). Allí hay que seleccionar el catálogo J/A+A/516/A23. Quitar el check en Show para las columnas _RA y _Dec. Bajamos el catálogo usando:
- max: unlimited
- ascii - 999'filled
  
Esto último significa que donde no hay datos, se va a rellenar la tabla con nueves.

Al archivo que descargamos lo llamaremos *p.dat*
  

### Utilizando esos datos, haga lo siguiente:

#### a) Seleccione solamente los objetos de la tabla cuya distancia al centro del cúmulo es mayor que 40 segundos de arco. Corrija por extinción los ı́ndices de color y las magnitudes de las estrellas dados en la tabla. Luego realice los diagramas color-magnitud: $V_0$ vs. $(B-V)_0$ , $I_0$ vs. $(V-I)_0$ y $V_0$ vs. $(B-I)_0$.
#### Datos adicionales: la escala de las imágenes es 0.417 segundos de arco por pixel. El centro del cúmulo se encuentra aproximadamente en las coordenadas $x_c$ = 1075.6 ; $y_c$ = 1157.8 pixeles.


In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
plt.style.use('../sisest.mplstyle')

En primer lugar conviene observar la tabla de datos usando un editor cualquiera, o incluso el de Astro Data Lab.

También se pueden mirar las primeras líneas así:

In [2]:
!head p.dat

 1   561.3   429.7  11.600  -0.067   0.485   0.549  99
   2  1977.5   324.3  11.740   0.529   1.148   1.146  99
   3   154.3   149.2  12.415   0.611   1.032   0.998  99
   4   790.2  1458.5  13.281   1.478   1.677   1.579  99
   5   724.7   245.3  13.540  -0.073   0.599   0.638  99
   6  1303.4   275.0  13.555   0.386   0.805   0.800  99
   7   152.5   967.1  13.665   0.022   0.641   0.729  99
   8  1064.8  1187.2  13.677   1.660   1.769   1.726  99
   9  1063.4  1251.3  13.704   1.357   1.540   1.515  99
  10   643.9  1209.0  13.717   0.430   0.795   0.808  99


Importamos el archivo usando pandas y lo llamamos *ngc1261.dat*

In [5]:
ngc1261 = pd.read_csv('p.dat', sep='\s+', 
                    names=['Seq', 'Xpos', 'Ypos', 'Vmag','UB','BV','VI','bs'])
ngc1261.head()

Unnamed: 0,Seq,Xpos,Ypos,Vmag,UB,BV,VI,bs
0,1,561.3,429.7,11.6,-0.067,0.485,0.549,99
1,2,1977.5,324.3,11.74,0.529,1.148,1.146,99
2,3,154.3,149.2,12.415,0.611,1.032,0.998,99
3,4,790.2,1458.5,13.281,1.478,1.677,1.579,99
4,5,724.7,245.3,13.54,-0.073,0.599,0.638,99


In [6]:
ngc1261.describe()

Unnamed: 0,Seq,Xpos,Ypos,Vmag,UB,BV,VI,bs
count,182.0,182.0,182.0,182.0,182.0,182.0,182.0,182.0
mean,91.5,1070.305495,1101.058242,15.129835,3.224934,3.127033,1.555456,99.0
std,52.683014,262.79172,267.699912,0.764195,16.313462,14.563639,7.340124,0.0
min,1.0,86.3,149.2,11.6,-0.14,0.335,0.439,99.0
25%,46.25,1010.95,1059.225,14.76125,0.27725,0.816,0.92125,99.0
50%,91.5,1071.3,1133.2,15.3255,0.4565,0.945,1.0055,99.0
75%,136.75,1136.625,1189.45,15.72425,0.6765,1.068,1.11025,99.0
max,182.0,2214.7,2189.4,16.038,99.999,99.999,99.999,99.0


Observemos que en los campos donde no hay valores observados hay nueves. Reemplazamos esos nueves con *NaN*, es decir *Not a Number*.

In [7]:
ngc1261 = ngc1261.replace(to_replace=99, value=np.nan)
ngc1261 = ngc1261.replace(to_replace=99.999, value=np.nan)
ngc1261.head()

Unnamed: 0,Seq,Xpos,Ypos,Vmag,UB,BV,VI,bs
0,1.0,561.3,429.7,11.6,-0.067,0.485,0.549,
1,2.0,1977.5,324.3,11.74,0.529,1.148,1.146,
2,3.0,154.3,149.2,12.415,0.611,1.032,0.998,
3,4.0,790.2,1458.5,13.281,1.478,1.677,1.579,
4,5.0,724.7,245.3,13.54,-0.073,0.599,0.638,


In [8]:
ngc1261.describe()

Unnamed: 0,Seq,Xpos,Ypos,Vmag,UB,BV,VI,bs
count,181.0,182.0,182.0,182.0,177.0,178.0,181.0,0.0
mean,91.458564,1070.305495,1101.058242,15.129835,0.491203,0.950135,1.011569,
std,52.826179,262.79172,267.699912,0.764195,0.341188,0.235178,0.199169,
min,1.0,86.3,149.2,11.6,-0.14,0.335,0.439,
25%,46.0,1010.95,1059.225,14.76125,0.276,0.816,0.921,
50%,91.0,1071.3,1133.2,15.3255,0.436,0.941,1.005,
75%,137.0,1136.625,1189.45,15.72425,0.65,1.06075,1.108,
max,182.0,2214.7,2189.4,16.038,1.66,1.769,1.726,


Observamos el número de filas del dataframe.


In [None]:
len(ngc1261.index)

Luego buscamos en NED las absorciones en las diferentes bandas y los excesos de color y las asignamos a diferentes variables. 

In [6]:
AU, AB, AV, AI = # COMPLETAR CON LOS VALORES DE NED


Ahora definimos variables con los excesos de color del cúmulo que vamos a necesitar.

Luego calculamos y agregamos al dataframe las magnitudes y los colores aparentes que faltan. 

Y por último calculamos las magnitudes intrínsecas y los colores desenrojecidos. 

In [7]:

E_BV = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR EL EXCESO DE COLOR DEL CÚMULO
E_VI = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR EL EXCESO DE COLOR DEL CÚMULO
E_BI = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR EL EXCESO DE COLOR DEL CÚMULO

ngc1261['I'] = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR LA MAGNITUD APARENTE DE CADA ESTRELLA
ngc1261['BI'] = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR EL ÍNDICE DE COLOR DE CADA ESTRELLA
ngc1261['V0'] = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR LA MAGNITUD INTRÍNSECA DE CADA ESTRELLA
ngc1261['I0'] = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR LA MAGNITUD ABSOLUTA DE CADA ESTRELLA
ngc1261['BV0'] = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR EL ÍNDICE DE COLOR DESENROJECIDO DE CADA ESTRELLA
ngc1261['VI0'] = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR EL ÍNDICE DE COLOR DESENROJECIDO DE CADA ESTRELLA
ngc1261['BI0'] = # COMPLETAR CON LA ECUACIÓN PARA CALCULAR EL ÍNDICE DE COLOR DESENROJECIDO DE CADA ESTRELLA

ngc1261


Para aplicar la condición respecto a la distancia al centro del cúmulo, conviene definir una función que calcule esa distancia.

In [9]:
def dist(x, y):
    # COMPLETAR ACÁ LA FUNCIÓN
    # TIENE QUE CALCULAR LA DISTANCIA DE UN PUNTO GENÉRICO (X,Y) AL CENTRO DEL CÚMULO
    
    return # AGREGAR LA VARIABLE QUE DEVOLVERÁ LA FUNCIÓN

Luego podemos usar esa función para generar un "nuevo" dataframe sólo con las estrellas que cumplen la condición de distancia. 


In [48]:
ngc1261e = ngc1261[ # COMPLETAR CON LA CONDICION DE SELECCION ]

Observamos el número de filas del nuevo arreglo.

In [None]:
len(ngc1261e.index)

Con este último arreglo ya podemos hacer los gráficos pedidos. Para estos gráficos conviene usar una tarea que permita controlar el tamaño de los puntos. También hay que elegir convenientemente el tamaño de los ejes, para que nos ayude a distinguir las estructuras.

In [1]:
# AGREGAR AQUÍ LAS CELDAS NECESARIAS PARA LOS GRÁFICOS.

#### b) Describa detalladamente los diagramas, indicando las distintas estructuras, de acuerdo a lo desarrollado en las clases de teorı́a.

Para señalar las estructuras se puede usar plt.annotate


In [None]:

plt.annotate('texto', xy = (x_inicio_flecha, y_inicio_flecha), 
             xytext = (x_del_texto, y_del_texto), arrowprops = dict(arrowstyle="->"))


### c) Estime la metalicidad total $[m/H]$ de NGC 1261 por medio de dos métodos fotométricos diferentes:
####  1) midiendo el ı́ndice $\Delta V_{1.4}$ y aplicando luego la relación $[m/H] = -0.280(\Delta V_{1.4} )^2$ + $0.717(\Delta V_{1.4})-0.918$

Para esto conviene graficar y medir los valores necesarios sobre el gráfico.

Resulta útil definir algunas variables que permitan editar fácilmente. Por ejemplo:

In [None]:
rh =    # magnitud de la rama horizontal

# ... ETCÉTERA

# las líneas horizontales y verticales se pueden trazar usando

plt.hlines(y_de_la_linea_horizontal, x_minimo, x_maximo, colors = 'color', ls='--')   

plt.vlines(x_de_la_linea_vertical, y_minimo, y_maximo, colors='color', ls='--')       



Una vez obtenidos los parámetros necesarios, se puede calcular el índice pedido y con él estimar la metalicidad.
Es una buena práctica imprimir al final los valores obtenidos en los pasos intermedios y el resultado final.

In [None]:
print('Delta V_{1.4} =', round(variable,2))

print('[m/H] =', round(variable,2))

####  2) midiendo el índice $S2.0$ y aplicando luego la relación $[m/H] = -0.29 (S2.0) + 0.53$

Para esto basta seguir el mismo procedimiento anterior.

In [3]:
### AGREGAR AQUÍ LAS CELDAS Y LOS COMANDOS NECESARIOS

####  Adopte el promedio de estas dos estimaciones como valor aproximado de la metalicidad total y obtenga el valor correspondiente de la fracción de masa $Z$, considerando $Z_{\odot}= 0.0152$.



Aquí calculamos el promedio de las metalicidades obtenidas antes y la fracción de masa Z.

#### d ) Estime el módulo de distancia del cúmulo empleando la magnitud $V$ de la rama horizontal $V(HB)$ y la relación:
#### $M_V(HB) = 0.15[F e/H] + 0.80$,
#### donde $[Fe/H]$ se puede obtener mediante la relación aproximada
#### $[Fe/H] = [m/H] - 0.9[\alpha/Fe]$,
#### con $[\alpha/F e] \sim 0.28$

Aquí, obviamente, caculamos primero $[Fe/H]$, luego $M_V(HB)$ y por último el módulo de distancia.

#### e) Utilice las isócronas de 6.3, 8.3, 10.3 y 12.3 Giga años (1 Giga año = $10^9$ años) que se encuentran en el Classroom para:
- **verificar** y eventualmente **corregir**, el módulo de distancia obtenido anteriormente $(m-M)_V$;
- estimar la edad del cúmulo;
- **verificar** y eventualmente **corregir**, la fracción de masa $Z$ obtenida anteriormente.
#### Realice este procedimiento empleando los diagramas $V_0$ vs. $(B-V)_0$ y $V_0$ vs. $(B-I)_0$.

Para importar las tablas de las isocronas se pueden usar comandos de este tipo.

In [None]:
t63 = pd.read_csv('6_3GYR.dat', sep='\s+', comment='#', 
            names=['Z','logage','M_ini','M_act','logL','logT','logG','mbol',
                     'U','B','V','R','I','J','H','K','int_IMF','stage'])

# LUEGO ESTE COMANDO SE REPITE PARA LAS OTRAS EDADES.


Es necesario observar cuáles son las metalicidades que tenemos en cada tabla. Eso se puede hacer simplemente desplegando la tabla con algún editor de texto. (Cuidado: ¡no modificar la tabla!)

Cada isocrona, dentro de la tabla, empieza con una línea así:

#### #	Isochrone  Z = 0.00130	Y = 0.25076	[M/H] = -1.076	eta_R = 0.200	Age = 	6.3000e+09 yr


Luego filtramos, dentro de las isocronas de una edad determinada, es decir en el dataframe que tiene esas isocronas, las que tienen una fracción de masa $Z$ igual, o lo más parecida posible, a la estimada anteriormente. 

Eso se repite para todas las edades.

Luego graficamos varias isocronas, con **distintas edades pero la misma $Z$**, junto con los datos, y estimamos la edad.

Recordar que **las magnitudes tabuladas en las isocronas son magnitudes absolutas**.

Tener cuidado en usar formatos y tamaños de puntos que nos permitan comparar adecuadamente.


Una vez que definimos una edad, la mantenemos fija y graficamos varias isocronas, con esa **misma edad, pero distintas $Z$**.

Para eso hay que filtrar nuevamente los dataframes con las tablas de isocronas, pero ahora usando varias $Z$.

Hay que usar varios valores de $Z$ **un poquito mayores y un poquito menores** que el estimado anteriormente, para poder comparar qué isocrona ajusta mejor los datos.

Hacer eso nos permitirá también cuantificar el error de nuestro método.

Todo el proceso se hace primero para $(B-V)_0$ y luego se repite para $(B-I)_0$ 