4.1 KiB
id | title | challengeType | forumTopicId | dashedName |
---|---|---|---|---|
5a23c84252665b21eecc7ec2 | Подібність Джаро | 5 | 302292 | jaro-distance |
--description--
Подібність Джаро — це міра схожості між двома рядками. Чим більший показник подібності Джаро для двох рядків, тим більше вони схожі. Оцінка нормується таким чином: 0
— схожість відсутня, а 1
— це точна схожість.
Визначення
Подібність Джаро \( d_j \) з двох вибраних рядків \((\1\) і \(s_2\) є
\begin{align}d_j = \begin{cases}0& & \text{if }m=0 \\\\{\frac {1}{3}}\left({\frac {m}{|s_{1}|}}+{\frac {m}{|s_{2}|}}+{\frac {m-t}{m}}\right)& & \text{otherwise}\end{cases}\end{align}
Де:
- \(m\) є числом відповідних символів;
- \(t\) — це половина числа транспозицій.
Два символи з \(s_1\) та \(s_2\) відповідно, вважаються співпадінням, якщо вони однакові і розташовані не далі, ніж \(\left\lfloor\frac{\max(|s_1|, s_2|)}{2}\right\rfloor-1\).
Кожен символ \(s_1\) порівнюється з усіма відповідними символами у \(s_2\) . Кількість відповідних (але в різному порядку) символів, розділених на 2, визначає кількість * транспозицій *.
Наприклад
У рядках \(s_1\) DWAYNE та \(s_2\) DUANE виявили:
- \(m = 4\)
- \(|s_1| = 6\)
- \(|s_2| = 5\)
- \(t = 0\)
Ми знайшли: \(d_j = \frac{1}{3}\left(\frac{4}{6} + \frac{4}{5} + \frac{4-0}{4}\right) = 0.822\).
--instructions--
Напишіть функцію а, у параметрах встановіть дві рядки. Це має бути схоже на подібність Джаро.
--hints--
jaro
має бути функцією.
assert(typeof jaro == 'function');
jaro("MARTHA", "MARHTA")
має повернути число.
assert(typeof jaro('MARTHA', 'MARHTA') == 'number');
jaro("MARTHA", "MARHTA")
має повернути 0.9444444444444445
.
assert.equal(jaro('MARTHA', 'MARHTA'), 0.9444444444444445);
jaro("DIXON", "DICKSONX")
має повернути 0.7666666666666666
.
assert.equal(jaro('DIXON', 'DICKSONX'), 0.7666666666666666);
jaro("JELLYFISH", "SMELLYFISH")
має повернути 0.8962962962962964
.
assert.equal(jaro('JELLYFISH', 'SMELLYFISH'), 0.8962962962962964);
jaro("HELLOS", "CHELLO")
має повернути 0.888888888888889
.
assert.equal(jaro('HELLOS', 'CHELLO'), 0.888888888888889);
jaro("ABCD", "BCDA")
має повернути 0.8333333333333334
.
assert.equal(jaro('ABCD', 'BCDA'), 0.8333333333333334);
--seed--
--seed-contents--
function jaro(s, t) {
}
--solutions--
function jaro(s, t) {
var s_len = s.length;
var t_len = t.length;
if (s_len == 0 && t_len == 0) return 1;
var match_distance = Math.max(s_len, t_len) / 2 - 1;
var s_matches = new Array(s_len);
var t_matches = new Array(t_len);
var matches = 0;
var transpositions = 0;
for (var i = 0; i < s_len; i++) {
var start = Math.max(0, i - match_distance);
var end = Math.min(i + match_distance + 1, t_len);
for (var j = start; j < end; j++) {
if (t_matches[j]) continue;
if (s.charAt(i) != t.charAt(j)) continue;
s_matches[i] = true;
t_matches[j] = true;
matches++;
break;
}
}
if (matches == 0) return 0;
var k = 0;
for (var i = 0; i < s_len; i++) {
if (!s_matches[i]) continue;
while (!t_matches[k]) k++;
if (s.charAt(i) != t.charAt(k)) transpositions++;
k++;
}
return ((matches / s_len) +
(matches / t_len) +
((matches - transpositions / 2.0) / matches)) / 3.0;
}