Definición
Un Data Set es un grupo de valores de datos que SAS crea y
procesa. Un conjunto de datos contiene una tabla con datos, compuesta por:
- Observaciones: no son más que lo registros que contiene el data set.
- Variables: podemos definir las variables como las características que describe la información que contiene el data set.
Hay dos tipos de conjuntos de datos SAS:
- Un archivo de datos SAS contiene tanto los datos como la información del descriptor. Los archivos de datos SAS tienen un tipo de miembro de DATOS.
- Una vista de datos SAS es un conjunto de datos virtuales que apunta a datos de otras fuentes. Las vistas de datos SAS tienen un tipo de miembro de VISTA (Consulte Vistas de datos SAS)
Como crear un Data Set.
Existen múltiples formas de crear un data set, en esta
entrada voy a explicar como crear usando Data Step.
- Usando Data Step.
El Data Step es un grupo de sentencias SAS, comienza con una
sentencia DATA. La instrucción DATA comienza el proceso de construcción de un Data
Set SAS y nombra el conjunto de datos. Las declaraciones que conforman el Data
Step se compilan y se comprueba la sintaxis. Si la sintaxis es correcta, entonces
se ejecutan las sentencias.
1.1 Definir solo la estructura:
Attrib Nro Length=$4;
Attrib Nombre Length=$50;
Attrib Fecha_Nacimiento Length=8 Informat=ANYDTDTE. Format=DDMMYY10.;
Attrib Nombre_Completo Length=$100;
Attrib Posicion Length=$4;
Attrib Batea Length=$4;
Attrib Lanza Length=$4;
Attrib Experiencia Length=$4;
Attrib País Length=$50;
Attrib Estado Length=$50;
Attrib Ciudad Length=$50;
Stop;
Run;
1.2 Utilizando Datalines:
Se define el data set y se ingresan los datos en el mismo
proceso.
Data Work.Magallanes;
Attrib Nro Length=$4;
Attrib Nombre Length=$50;
Attrib Fecha_Nacimiento Length=8 Informat=ANYDTDTE. Format=DDMMYY10.;
Attrib Nombre_Completo Length=$100;
Attrib Posicion Length=$4;
Attrib Batea Length=$4;
Attrib Lanza Length=$4;
Attrib Experiencia Length=$4;
Attrib País Length=$50;
Attrib Estado Length=$50;
Attrib Ciudad Length=$50;
Infile Datalines4 DSD;
Input Nro $ Nombre $ Fecha_Nacimiento DDMMYY10. Nombre_Completo $
Posicion $ Batea $ Lanza $ Experiencia $ País $ Estado $ Ciudad $;
datalines4;
1,A. Alcántara,29/10/1991,Arismendy Alcantara,SS,A,D,1,Republica Dominicana,,Santo Domingo
2,H. Álvarez,18/04/1990,Henderson Javier Álvarez,P,D,D,5,Venezuela,Carabobo,Valencia
3,M. Antonini,06/08/1985,Michael John Antonini,P,D,Z,3,USA,Pensilnavia,Drexel Hill
4,L. Arraez,09/04/1997,Luis Sangel Arraez,2B,Z,D,4,Venezuela,Yaracuy,San Felipe
5,R. Ascanio,17/03/1996,Rayder Alejandro Ascanio,SS,A,D,5,Venezuela,Carabobo,Mariara
6,W. Becerra,01/10/1994,Wuilmer Gabriel Becerra,BD,D,D,4,Venezuela,D.F.,Caracas
7,A. Blanco,11/04/1984,Andrés Eloy Blanco Pérez,SS,A,D,12,Venezuela,Carabobo,Urama
8,W. Boscán,26/10/1989,Wilfredo Boscán,P,D,D,8,Venezuela,Zulia,Maracaibo
9,L. Carrasco,11/09/1994,Luis Alberto Carrasco,P,D,D,1,Venezuela,Bolivar,Puerto Ordaz
10,A. Castellano,13/01/1995,Angelo Alfonso Castellano,SS,D,D,4,Venezuela,Carabobo,San Diego
11,R. Cedeño,02/02/1983,Ronny Alexander Cedeño,SS,D,D,14,Venezuela,Carabobo,Puerto Cabello
12,E. Chávez,07/02/1978,Endy Chávez,OF,Z,Z,21,Venezuela,Carabobo,Valencia
13,J. Davis,26/04/1990,Johnathan Lewis Davis,LF,A,D,2,USA,California,Compton
14,E. De Jesús,10/12/1996,Enmanuel José De Jesús,P,Z,Z,2,Venezuela,Carabobo,Valencia
15,F. Díaz,06/10/1983,Frank Isaías Díaz,OF,D,D,17,Venezuela,Carabobo,Valencia
16,J. Dominguez,07/08/1990,Jose Alfredo Dominguez Colome,P,D,D,1,Republica Dominicana,,San Pedro de Macoris
;;;;
Run;
Attrib Nro Length=$4;
Attrib Nombre Length=$50;
Attrib Fecha_Nacimiento Length=8 Informat=ANYDTDTE. Format=DDMMYY10.;
Attrib Nombre_Completo Length=$100;
Attrib Posicion Length=$4;
Attrib Batea Length=$4;
Attrib Lanza Length=$4;
Attrib Experiencia Length=$4;
Attrib País Length=$50;
Attrib Estado Length=$50;
Attrib Ciudad Length=$50;
Infile Datalines4 DSD;
Input Nro $ Nombre $ Fecha_Nacimiento DDMMYY10. Nombre_Completo $
Posicion $ Batea $ Lanza $ Experiencia $ País $ Estado $ Ciudad $;
datalines4;
1,A. Alcántara,29/10/1991,Arismendy Alcantara,SS,A,D,1,Republica Dominicana,,Santo Domingo
2,H. Álvarez,18/04/1990,Henderson Javier Álvarez,P,D,D,5,Venezuela,Carabobo,Valencia
3,M. Antonini,06/08/1985,Michael John Antonini,P,D,Z,3,USA,Pensilnavia,Drexel Hill
4,L. Arraez,09/04/1997,Luis Sangel Arraez,2B,Z,D,4,Venezuela,Yaracuy,San Felipe
5,R. Ascanio,17/03/1996,Rayder Alejandro Ascanio,SS,A,D,5,Venezuela,Carabobo,Mariara
6,W. Becerra,01/10/1994,Wuilmer Gabriel Becerra,BD,D,D,4,Venezuela,D.F.,Caracas
7,A. Blanco,11/04/1984,Andrés Eloy Blanco Pérez,SS,A,D,12,Venezuela,Carabobo,Urama
8,W. Boscán,26/10/1989,Wilfredo Boscán,P,D,D,8,Venezuela,Zulia,Maracaibo
9,L. Carrasco,11/09/1994,Luis Alberto Carrasco,P,D,D,1,Venezuela,Bolivar,Puerto Ordaz
10,A. Castellano,13/01/1995,Angelo Alfonso Castellano,SS,D,D,4,Venezuela,Carabobo,San Diego
11,R. Cedeño,02/02/1983,Ronny Alexander Cedeño,SS,D,D,14,Venezuela,Carabobo,Puerto Cabello
12,E. Chávez,07/02/1978,Endy Chávez,OF,Z,Z,21,Venezuela,Carabobo,Valencia
13,J. Davis,26/04/1990,Johnathan Lewis Davis,LF,A,D,2,USA,California,Compton
14,E. De Jesús,10/12/1996,Enmanuel José De Jesús,P,Z,Z,2,Venezuela,Carabobo,Valencia
15,F. Díaz,06/10/1983,Frank Isaías Díaz,OF,D,D,17,Venezuela,Carabobo,Valencia
16,J. Dominguez,07/08/1990,Jose Alfredo Dominguez Colome,P,D,D,1,Republica Dominicana,,San Pedro de Macoris
;;;;
Run;
1.3 Basado en un Data Set ya existente.
Se define el data set tomando como base la estructura y los datos de un Data Set existente, en este caso (Work.Magallanes).
El siguiente ejemplo toma como base la estructura de un Data Set existente (Work.Magallanes) para crear el nuevo Data Set sin datos, es decir solo la estructura.
No hay comentarios.:
Publicar un comentario