Respecto de la Base de Datos del Proyecto

José Munizaga R. 9 Dic 202109/12/21 a las 14:26 hrs.2021-12-09 14:26:09

Claramente la base de datos tiene muchas filas y eso hace que el análisis de EXCEL sea extremadamente lento, sobre todo el copiado y pegado de formulas que requieren el uso de condicionales y la gran cantidad de datos a los que se debe aplicar la operacion (108.000 por 50 aprox.). En particular, el ejemplo que esta en el video y para el cual copie la formula de valorizacion para las restantes columnas hizo que mi computador se cayera despues de como una hora de espera, asi que no tengo el archivo de ese ejemplo, solo lo que se ve en el video de la sesion.

Sugiero que escojan algunos bloques de cada nivel de tal forma de que el número total de bloques en el modelo no sea mayor que 15.000 bloques (un poco mas del 13% de lo que actualmente tiene la base). Con esto, se obtiene una planilla que si bien no volará, no tomará más de una hora en actualizarse que es lo que me ha pasado a mi en el ejemplo que traté de hacer.

La selección pueden hacerla al azar intentando dejar un número razonablemente parecido en cada nivel. La otra posibilidad podría ser crear bloques "más grandes" agregando bloques en grupos de a 10, pero se me ocurre que esta opción es un poco lenta de implementar y no me queda claro en EXCEL... La primera opción se puede implementar con un número aleatorio, crear una columna copiando dicho valor creado con la funcion RAND(), ordenar de  menor a mayor de acuerdo a esa columna aleatoria y seleccionar tantos bloques como sea necesario.

Salu2, Charango
Compartir
Última Modificación 9 Dic 202109/12/21 a las 14:49 hrs.2021-12-09 14:49:09
Vistas Únicas 20
Comentarios
  • José Munizaga R.

    12 Dic 202112/12/21 a las 22:30 hrs.2021-12-12 22:30:12

    Si se crea una columna en que se coloca esta función para todos los elementos de la columna, se copia y se pega como texto en una columna adicional del archivo EXCEL, entonces es posible ordenar toda la tabla en referencia a esta columna con números en el intervalo [0,1] (ya sea de mayor a menor o de menor a mayor). Cuando esto ya está hecho, entonces ers posible seleccionar los primeros N elementos de esta lista que se constituyen por este mecanismo en una muestra uniforme, del tamaño deseado, de la base de datos. La idea detrás de hacer esto es poder obtener una base de datos de tamaño reducido a partir de la base original que reproduzca la distirbución global de los datos, en particular, se espera que los distintos períodos de extracción de los bloques estén bien representados. Todo esto por culpa del tiempo de procesamiento excesivo que tomaría en la base de datos original.

    Salu2, Charango

  • José Munizaga R.

    12 Dic 202112/12/21 a las 22:25 hrs.2021-12-12 22:25:12

    La función ALEATORIO() en EXCEL genera un numero pseudo-aleatorio distribuído uniformemente.

  • Gonzalo Robledo R.

    11 Dic 202111/12/21 a las 23:18 hrs.2021-12-11 23:18:11

    Buenas noches, favor podría comentar mas a detalle la manera de poder "discriminar" algunos bloques, específicamente al uso de la función ALEATORIO que nombras en las ultimas líneas.

    Saludos.