Hola amigos de Hive 💕 bienvenidos a mi blog.
Nada como tener conocimiento de diversos ámbitos y en especial utilizar la estadística para agilizar calculo que te permiten reducir resultados es por eso que te traigo un ensayo aplicando la estadistas aplicada, llevado a la ingeniera, es muy importante tener presente que el flujo de gas natural extraído de un pozo es controlado a través de un arreglo mecánico ensamblado en el cabezal del mismo. Otro detalle importante, es tener claro que la producción de gas natural de varios pozos de gas natural de campo de producción; obedece a una volumetría que pueden ser: manipulada y tratada de acuerdo a la capacidad de la infraestructura de superficie construida para uno o varios propósitos.
|

Foto de Roslynn Farias
|
Se trata de verificar si existe un nivel o grado de relación lineal entre: (a) el tiempo de duración en horas de la apertura fija configurada de la válvula de control en el pozo y (b) el caudal o flujo de gas natural medido y extraído del mismo. La prueba de los 26 pozos tiene un rango de una semana. Se desea verificar si a mayor tiempo de duración de la apertura fijada en la válvula de control, mayor será el caudal o el flujo de gas natural extraído expresado en unidades MMPCND, y viceversa, cuando el tiempo de duración de la apertura fija de la válvula de control es menor, menor será el flujo de gas natural obtenido.
Para demostrar si existe está relación lineal directa o proporcional directa entre el tiempo de duración en horas de la válvula de control que podemos controlar de manera automática o manual (variable independiente) y el caudal o flujo de gas natural medidor en el cabezal del pozo (variable dependiente).
Para los fines de la prueba de pozos, hemos denotado: el tiempo de duración en horas de la apertura fija de la válvula de control como la
variable independiente con la letra “X” y sea el caudal o flujo de gas natural medido la variable dependiente que hemos designado como “Y”.
|

[Fuente](Trabajo realizado en Excel por Roslynn Farias)
|
Para los fines del estudio como parte del examen final, se dispone de
la tabla de datos reales siguiente:
Tabla # 1 – Valores de Tiempo de Duración (Hrs) y Caudales de Gas (MMPCND)
Como se indica el resaltado de color amarillo, los 26 pozos productores de gas natural fueron sometidos a una prueba de pozo y se
midió el tiempo duración en horas y al mismo tiempo se midió su flujo de
gas extraído en unidades MMPCND.
Para responder esta primera pregunta, se construyó una hoja de cálculo utilizando la herramienta de Microsoft Office, Excel. Se procede con la elaboración de una tabla # 2 similar a la tabla # 1 suministrada. Además
del Diagrama de Dispersión (Caudal (MMPCND) versus Duración en Horas),
se elaboró un gráfico de estas dos variables: Duración y Caudal de Gas.
|

[Fuente](Trabajo realizado en Excel por Roslynn Farias)
|
Para fines de prácticos, se indico que el tiempo de duración en horas es la variable independiente (Letra “X”) y el caudal de gas o flujo de gas natural expresado en MMPCND, es la variable dependiente (Letra “Y”).
Del diagrama de dispersión (gráfica # 1), se evidencia en una primera instancia, la existencia de una relación lineal tipo proporcional entre el tiempo de duración en horas de las pruebas de pozos y el volumen
total de gas natural que resulta de la suma de los caudales o flujos de gas individual de cada pozo expresado en MMPCND, es decir, que el flujo de gas de cada pozo aumenta cuando aumenta el tiempo de duración de su
prueba. De igual manera, si el caudal de flujo gas disminuye debido a una reducción del tiempo de duración de su prueba.
Esta apreciación se observa en la gráfica # 2, esta muestra el “efecto” directo de la variable independiente “X: Tiempo de duración en Hrs
de la Prueba” sobre la variable independiente “Y: Caudal o flujo de gas en MMPCND medido”. Por consiguiente, se continúa con este estudio con la finalidad de buscar y calcular más pruebas evidénciales que permita demostrar si existe relación lineal entre ambas variables.
|

[Fuente](Trabajo realizado en Excel por Roslynn Farias)
|
Para responde esta pregunta, es necesario establecer las propiedades del coeficiente de correlación denotado por la letra “r”, así
como las premisas de la Covarianza “Sxy”.
Sea la ecuación del coeficiente de correlación:
1.“Sxy”, es la “cuasi covarianza”, por estar dividida entre (n-1), este parámetro mide el grado de variación conjunta de
ambas variables (tiempo de duración en hora de la prueba de pozo y caudal de gas medido) con respecto a sus medias calculadas en base a la tabla # 1 o tabla # 2.
2."Sx”, es la desviación muestral o la desviación estándar obtenida de la variable independiente “X” correspondiente a
los valores del tiempo de duración de la prueba de pozo durante la semana.
3.“Sy”, es la desviación muestral o la desviación estándar
obtenida de la variable dependiente “Y” correspondiente a los
valores de los caudales o flujo de gas medidos en cada pozo durante la prueba.
|
|
4.Si el valor de Sxy > 0, entonces hay dependencia directa (positiva), es decir, sí el tiempo de duración (horas) de las pruebas de pozos es mayor, mayor será el caudal o flujo de gas medido y por ende su aporte a la volumetría general de la prueba.
5.Si el valor de Sxy = 0, se interpreta como la no existencia de relación lineal entre el tiempo de duración (hrs) de la prueba
de pozos y el caudal o flujo de gas medido en la prueba.
6.Si el valor de Sxy < 0, se interpreta que existe una relación lineal inversa o negativa.
|
|
7.El coeficiente de correlación lineal “r” no tiene dimensión y está dentro de un rango de valores estrecho de: [-1;+1].
8.Si la variable dependiente (Y: caudal o flujo de gas medido (MMPCND)) y la variable independiente (X: tiempo de duración (hrs) de la prueba de pozo), son INDEPENIENTES, el valor de r = 0.
9.Si existe una relación lineal exacta entre: X: tiempo de duración de la prueba de pozo, e Y: caudal o flujo de gas medido por pozo, el valor de r = 1. Y valdría -1, si no hay relación lineal entre el tiempo de duración de la prueba y el
caudal de gas medido.
10.Si r > 0, entonces hay una relación directa entre el tiempo
de duración de la prueba y el caudal de gas medido. Cuando aumenta el tiempo de duración de la prueba de pozo, también
aumenta los valores medidos del caudal de gas.
11.Si r < 0, entonces hay una relación inversa entre el tiempo de duración de la prueba de pozo y el caudal de gas medido, cuando aumenta el tiempo de duración de la prueba de pozos, los valores del caudal de gas medido son muy bajos. Para el cálculo del coeficiente de correlación lineal “r” hacernos uso de la tabla # 3 de la página siguiente y los siguientes cálculos:
Paso No 1: Calcular la media de los tiempos de duración (X):
= 639/26 = 24,58.
Paso No 2: Calcular la media de los caudales de gas medido (Y):
= 401/26 = 15,41.
|
|
Paso No 3: Calcular la Cuasi Covarianza de la Tabla de Pruebas.
Ecuación de la “cuasi” covarianza:
= 249/25 = 9,96
Como Sxy > 0, se cumple con el punto # 4 antes citado. Si hay dependencia directa (positiva), es decir, sí el tiempo de duración (horas) de
las pruebas de pozos es mayor, mayor será el caudal o flujo de gas medido y por ende su aporte a la volumetría general de la prueba.
Paso No 4, se calcula la desviación el tiempo de duración (“X”).
= 866/25 = 34,65
= 5,89
Paso No 5, se calcula la desviación de los caudales de gas (“Y”).
= 2,06
Paso No 6, se procede a calcular el coeficiente de correlación “r”.
r = (9,96) / (5,89) (2,06) = (9,96) / (12,13) = 0,82.
Interpretación r = 0,82. Se evidencia que su valore está dentro del rango [-1;+1] y su valor es mayor que cero (r >0) por lo tanto se demuestra que hay una relación directa entre el tiempo de duración de la prueba de pozos y el flujo de gas medido de cada pozo. Finalmente, como el valor de r=0,82 es muy próximo a 1 se concluye que la relación además de ser directa es muy exacta y se evidencia en el diagrama de dispersión
(gráfica # 1) y en la gráfica # 2 que muestra el comportamiento de ambas variables.
|
|
Siendo “b” la pendiente de la recta de regresión lineal Ȳ = b X + a, si X = 0, entonces: Ȳ = a, por lo tanto el corte con el eje de las ordenadas será para X=0. Si el conjunto de pares (X: tiempo de duración de la
prueba de pozos; Y: caudal de gas medido) tienen una distribución normal con media µ = b y con desviación estándar σ, definido por la ecuación siguiente:
Siendo el estimador de la desviación estándar “σ” el parámetro “S” como el estimador de la desviación estándar del conjunto de pares (X: tiempo de duración de la prueba de pozos; Y: caudal de gas medido), la desviación estándar para la pendiente de la recta de regresión lineal “b” será “S”, cuyo valor se calcula en función del Cuadrado Medio de los Errores CME. Este parámetro a su vez se calcula en términos de la suma de
cuadrado de los errores (CME) mediante la ecuación siguiente:
Donde la SCE se obtiene de la tiene ecuación siguiente:
1,1915
Reemplazando la desviación estándar “σ” por su estimador “S” en la
ecuación siguiente:
ܵ ൌ = 0,0405
Se había indicado que la media µ = b, siendo “b” la pendiente de la
recta de regresión lineal calculada por el método de los mínimos
cuadrados, se formula la hipótesis nula Ho de la siguiente forma:
Tal como se indica: la hipótesis nula “Ho: b=0” establece que la pendiente de la recta de regresión lineal es igual a cero y no hay relación lineal entre el tiempo de duración de la prueba de pozo y el caudal de gas
medido. Es decir, X: el tiempo de duración de la prueba de pozos es independiente del caudal de gas medido.
Si la hipótesis Ho es rechazada, se acepta como verdadera la hipótesis alternativa “H1” que es lo contrario. Es decir, si hay relación lineal entre el tiempo de duración de la prueba de pozo y el caudal de gas.
|
|
Para un nivel de significancia de ߙ ൌ 0,05 se hará uso del estimador de la “t” de Student calculada “tc” el siguiente estimador:
= 0,29 / 0,0405 = 7,17
Se establece: Sí el valor tc > t (ߙ/2ሻ; con (n-2) grados de libertad
obtenido de la tabla de distribución t – Student, entonces se rechaza la
hipótesis nula “H0” y se acepta la hipótesis alternativa “H1”.
|

[Fuente](Trabajo realizado en Excel por Roslynn Farias)
|
Se indica en la imagen de la tabla # 3, el valor crítico de “t” para el
rechazo o aceptación de la hipótesis nula “H0” con nivel de significancia del 5% y con (n-2) = 26 – 2 = 24 grados de libertad es 2,064.
Por lo tanto, si hay relación lineal entre el tiempo de duración de la prueba de pozos y el caudal de gas medido durante la misma.
|

[Fuente](Trabajo realizado en Excel por Roslynn Farias)