Instruções
Distância de Jaro
A distância de Jaro é uma medida de semelhança entre duas strings. Quanto maior a distância de Jaro entre as duas strings, mais parecidas elas são. A pontuação é normalizada, de modo que
0 é igual a nenhuma similaridade e 1 é uma correspondência exata.
Definição
A distância de Jaro \\( d_j \\) de duas strings fornecidas \\(s_1\\) e \\(s_2\\) é
\\begin{align}d_j = \\begin{cases}0& & \\text{if }m=0 \\\\\\\\{\\frac {1}{3}}\\left({\\frac {m}{|s\_{1}|}}+{\\frac {m}{|s\_{2}|}}+{\\frac {m-t}{m}}\\right)& & \\text{otherwise}\\end{cases}\\end{align}
Onde:
<ul>
<li>\(m\) is the number of <i>matching characters</i>;</li>
<li> \(t\) is half the number of <i>transpositions</i>.</li>
</ul>
Dois caracteres de \\(s_1\\) e \\(s_2\\) respectivamente, são considerados *matching* somente se forem iguais e não estiverem a uma distância maior que \\(\\left\\lfloor\\frac{\\max(|s_1|,|s_2|)}{2}\\right\\rfloor-1\\).
Cada caractere de \\(s_1\\) é comparado com todos os seus caracteres correspondentes em \\(s_2\\) . O número de caracteres correspondentes (mas em ordem de sequência diferente) dividido por 2 define o número de *transposições*.
Exemplo
Dadas as strings \\(s_1\\) *DWAYNE* e \\(s_2\\) *DUANE* encontramos:
<ul>
<li>\(m = 4\)</li>
<li>\(|s_1| = 6\)</li>
<li>\(|s_2| = 5\)</li>
<li>\(t = 0\)</li>
</ul>
Encontramos uma pontuação de Jaro de: \\(d_j = \\frac{1}{3}\\left(\\frac{4}{6} + \\frac{4}{5} + \\frac{4-0}{4}\\right) = 0.822\\).
O que fazer:
Escreva uma função que receba duas strings como parâmetros e retorne a distância de Jaro associada.
Critérios de Aceitação:
Critérios de Aceitação:
Testes:
- `jaro` deve ser uma função.
- `jaro("MARTHA", "MARHTA")` deve retornar um número.
- `jaro("MARTHA", "MARHTA")` deve retornar `0.9444444444444445`.
- `jaro("DIXON", "DICKSONX")` deve retornar `0.7666666666666666`.
- `jaro("JELLYFISH", "SMELLYFISH")` deve retornar `0.8962962962962964`.
- `jaro("HELLOS", "CHELLO")` deve retornar `0.888888888888889`.
- `jaro("ABCD", "BCDA")` deve retornar `0.8333333333333334`.
Console