Wikilivros:AutoWikiBrowser/Typos/Guia

Estas são as expressões regulares para correção de erros (typos) do RegExTypoFix. O desenvolvimento é aberto ao público desde 2006 na Wikipédia inglesa, e desde 2011 na Wikipédia lusófona.

Por favor, acrescente ou melhore estas expressões regulares!

Descrição editar

Estas expressões regulares encontram e corrigir erros comuns. A sintaxe das expressões é descrita na íntegra no site MSDN, embora para os fins desta página o sumário da Well House é provavelmente mais fácil de usar.

Embora o objetivo inicial deste projeto tenha sido o de obter 100% de precisão, a lista atual, que é menos precisa mas mais inclusiva, é melhor (pelo menos a da versão inglesa).

Todos os editores que usarem o RegExTypoFix devem fazê-lo de forma responsável. Verifique todas as edições antes de fazê-las. Em caso de dúvida, simplesmente pule.

Esta lista de erros de digitação também é usada pelo editor de texto e gadget da Wikipédia wikEd.

A correção de typos é impedida automaticamente nos nomes das imagens, nas predefinições, nos alvos dos links internos e nas citações (incluindo parágrafos recuados). Se uma regra de correção de erros corresponde ao alvo de um link interno, esta regra será ignorada na página inteira.

Acrescentando e alterando erros de ortografia editar

Antes de editar esta página editar

  • Teste a sua proposta de mudança por meio de uma pesquisa comum na página de buscas ou uma busca no Google através do AWB com uma regra "localizar e substituir" configurada. Isto pode revelar que a sua regra em alguns casos danifica textos corretos ou, em outras circunstâncias, faz a correção errada. Nestes casos, não adicione a regra aqui, em vez disso, considere adicioná-la a lista de erros comuns.
  • Se você não sabe como fazer uma mudança, é recomendado que utilize a página de discussão, para que um usuário mais experiente modifique para você.
  • Tenha em mente que cada adição ou possibilidade de uma palavra usa mais CPU e deixa o processamento mais lento.
  • Observe que apenas palavras fora da marcação wiki são corrigidas, portanto uma regra para corrigir, por exemplo, uma predefinição não vai funcionar.

Como escrever regras para corrigir erros de digitação editar

  • Procure ter uma regra única para cada palavra raiz, prefixo e sufixo.
  • Evite regras que detectem palavras com a ortografia correta (isto é, "falsos positivos": por exemplo, uma regra que corrige housa para house não deve detectar thousand, e nem deve detectar house).
  • Não crie uma regra em que a expressão regular não corresponde ao valor de captura da expressão regular, já que o AWB não pode mostrar tais substituições no sumário de edição. (Por exemplo, não use um lookahead no final de uma expressão regular).
  • Não suponha que as regras serão aplicadas na ordem em que aparecem na página.
  • Só use os quantificadores * e + para repetir um único caractere. Sempre que possível, evite repetições de expressões maiores, uma vez que elas exigem mais trabalho da CPU e são propensas a fazer coisas inesperadas.
  • Cada regra deve ser completamente independente das demais.
  • Na edição de uma regra, edite somente a menor seção desta página que for apropriada, em vez de editar a página toda, que exigiria mais CPU e largura de banda.
  • Atualize o nome da regra, se você mudar algo que o afeta.

Como testar as regras de correção dos erro de digitação editar

Antes de incluir uma regra, teste-a:

  • Com o testador de expressões regulares do AWB ou algo similar (exemplos: RegExPal, My Regex Tester, Rubular).
  • Com o AWB ou o WikiEd imediatamente depois de adicioná-las. Se não funcionar, primeiro remova-a e então analise-a.

Tarefas pendentes editar

  • Remover duplicatas.
  • Expandir regras para que aceitem mais sufixos (por exemplo, "-ing", "-ed", "-able", no caso dos verbos em inglês) e prefixos.
    • Note que algumas expressões regulares propositadamente corrigem apenas certas versões de uma palavra para evitar falsos positivos. Estas devem ser marcadas com um caractere sublinhado "_" no início ou no fim do campo word=.
  • Remova palavras raras. Note, no entanto, que não a ausência de ocorrências hoje não significa que uma regra se aplica em casos muito raros, pois pode ser que outro usuário tenha usado a regra ontem para corrigir muitos artigos.
  • Mantenha as listas ordenadas alfabeticamente pela palavra raiz, por exemplo, coloque "(Un)Equal" pouco antes "(In)Equality" entre as palavras da letra "E". Não ordene, digamos, pelo valor de caracteres ASCII.
  • Ignore palavras cercadas por "." como em www.harvard.edu.

Lista de erros editar

Todas as alterações a essa lista têm efeito na hora. O AWB obtém esta lista diretamente sempre que alguém invoca a opção Enable RegexTypoFix.