Introducción a las funciones de cadena R

El lenguaje R o las funciones de cadena R están implicadas principalmente para la representación gráfica de los datos, el análisis estadístico de los datos y los informes. Es un lenguaje de código abierto. La convención de nomenclatura de este idioma se derivó de las primeras letras de los fundadores de este idioma: Ross Ihaka y Robert Gentleman. Es un lenguaje de programación interpretado. Tiene la capacidad de integrarse con varios otros procedimientos de lenguaje, a saber, C ++, Python, etc. Actualmente, R es el lenguaje de programación más utilizado en el mundo.

Características de las funciones de cadena R

Las características clave del lenguaje R son las siguientes:

  • Un lenguaje estadístico finamente desarrollado y muy simple.
  • El almacenamiento y el manejo de datos están integrados de manera muy eficiente en R.
  • Ofrece un amplio conjunto de herramientas clasificadas que ayudan en el análisis de datos.
  • R también ofrece bibliotecas para lograr representaciones gráficas de los datos.

Manipulación de funciones de cadena R

A continuación se muestra la lista de funciones de manipulación de cadenas R.

1. Grep () en funciones de cadena R

Se usa para hacer coincidir un patrón en los datos y reemplazar el patrón con una cadena diferente. La función grep se puede expresar de varias maneras en lenguaje R: regexpr, gregexpr grep, grepl y regexec.

Ej: grep (patrón, x, ignorar. Caso = FALSO, perl = FALSO, valor = FALSO, fijo = FALSO, usar Bytes = FALSO, invertir = FALSO)

Argumentos:

  • Patrón: cadena de caracteres que contiene una expresión habitual que se supone que es igual al vector de caracteres dado.
  • X, Texto: un objeto que se puede limitar como carácter a un vector de caracteres.
  • Ignorar. Mayúsculas y minúsculas: (Falso: la coincidencia de patrones funciona entre mayúsculas y minúsculas, Verdadero: la coincidencia de patrones funciona entre mayúsculas y minúsculas)
  • Perl: para determinar expresiones compatibles con Perl, se deben usar especialmente expresiones regulares.
  • Valor: si una coincidencia encontrada devuelve verdadero o falso,
  • Usar bytes: si es VERDADERO, la coincidencia se realizará byte a byte en lugar de carácter a carácter.
  • Invertir: devuelve índices si es verdadero,
  • Reemplazo: la cadena de reemplazo,

2. Nchar ()

Se usa para contar el número de caracteres en un vector. Toma un vector en formato de cadena como argumento y devuelve otro vector numérico que contiene el recuento de la cadena.

Ej: nchar (x, type = "chars", allowNA = FALSE, keepNA = NA)

Argumentos:

  • X: cadena de vectores.
  • Tipo - Tipo, de la cadena de caracteres, los tres comunes mencionados son ("bytes", "caracteres", "ancho").
  • AllowNA: representa si el 'No aplicable' se puede devolver como salida.
  • KeepNA: en caso de que no se encuentre X, debería devolverse 'No aplicable'.

3.Substr ()

Se utiliza para elegir el valor de la subcadena del vector de caracteres.

Ej: substr (x, inicio, parada)

Argumentos:

  • X, texto: la cadena del fletador de vectores.
  • Inicio, primer entero. Inicio del elemento que se espera reemplazar
  • Para, último - entero. aquí el reemplazo se realiza al final de la cadena

4. strsplit () en funciones de cadena R

Se usa para dividir una cadena de vectores existente en múltiples subcadenas de acuerdo con las coincidencias de subcadenas encontradas dentro de ellas

Ej: strsplit (x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)

Argumentos:

  • X: vector de caracteres que se va a escupir.
  • Split - Vector de caracteres que actúa como separador.
  • Corregido: realiza una división equitativa cuando se pasa como verdadero
  • Perl: ¿se deben utilizar expresiones regulares compatibles con Perl?
  • UseBytes: cuando se pasa como verdadero, activa la coincidencia byte por byte en lugar de la coincidencia carácter por carácter

5. Regexpr ()

Más que grep, regexpr proporciona el índice donde comienza una coincidencia válida y la longitud de la cadena coincidente cuando no se encuentra ninguna coincidencia.

Ej: regexpr (patrón, texto, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)

Argumentos:

  • Patrón: cadena de caracteres que contiene una expresión habitual que se supone que es igual al vector de caracteres dado.
  • X - Vector de caracteres
  • Ignorar.case - (Falso - La coincidencia de patrones funciona entre mayúsculas y minúsculas, Verdadero - La coincidencia de patrones funciona entre mayúsculas y minúsculas)
  • Perl: para determinar expresiones compatibles con Perl, se utilizarán especialmente expresiones regulares.
  • Valor: si se encuentra una coincidencia, se devuelve verdadero o falso
  • UseBytes: si es VERDADERO, la coincidencia se realizará byte a byte en lugar de carácter a carácter.
  • Invertir: devuelve índices si es verdadero

6. Gregexpr () en funciones de cadena R

Gregexpr provide devuelve una lista de una longitud similar a un texto cuyos elementos tienen una forma similar al valor de retorno de regexpr, excepto que se dan las posiciones preliminares de cada coincidencia (disjunta).

Sintaxis: gregexpr (patrón, texto, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE, extract = FALSE)

Argumentos:

  • Patrón: cadena de caracteres que contiene una expresión habitual que se supone que es igual al vector de caracteres dado.
  • X - Vector de caracteres
  • Ignorar.case - (Falso - La coincidencia de patrones funciona entre mayúsculas y minúsculas, Verdadero - La coincidencia de patrones funciona entre mayúsculas y minúsculas)
  • Perl: para determinar expresiones compatibles con Perl, se utilizarán especialmente expresiones regulares.
  • Valor: si se encuentra una coincidencia, se devuelve verdadero o falso
  • UseBytes: si es VERDADERO, la coincidencia se realizará byte a byte en lugar de carácter a carácter.
  • Invertir: devuelve índices si es verdadero
  • Extracto: cuando se hace coincidir una indicación lógica, se realiza un extracto de la subcadena y se devuelve

7. Regexec ()

El regexec () en R String Functions es muy similar a regexpr (), excepto que aquí los índices entre paréntesis devuelven las subexpresiones correspondientes

Sintaxis: regexec (patrón, texto, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)

Argumentos:

  • Patrón: cadena de caracteres que contiene una expresión habitual que se supone que es igual al vector de caracteres dado.
  • X - Vector de caracteres
  • Ignorar.case - (Falso - La coincidencia de patrones funciona entre mayúsculas y minúsculas, Verdadero - La coincidencia de patrones funciona entre mayúsculas y minúsculas)
  • Perl: para determinar las expresiones compatibles con Perl, se deben usar especialmente expresiones regulares.
  • Valor: si se encuentra una coincidencia, se devuelve verdadero o falso
  • UseBytes: si es VERDADERO, la coincidencia se realizará byte a byte en lugar de carácter a carácter.
  • Invertir: devuelve índices si es verdadero

Artículos recomendados

Esta ha sido una guía para las funciones de cadena R. Aquí discutimos el concepto, las características, la manipulación de las funciones de cadena R con ejemplos y argumentos. También puede consultar nuestros otros artículos sugeridos para obtener más información:

  1. Funciones de cadena de JavaScript
  2. Funciones de cadena de Oracle
  3. Funciones de cadena T-SQL
  4. Funciones de cadena de VBScript
  5. Funciones de expresiones regulares en Python (ejemplo)