А на следующей неделе я еду в Майами, презентовать эту статью на конференции EMNLP.
Если вы тоже там будете, буду рад увидеться)
Добро пожаловать в Telegram-канал "самоизолента мёбиуса"! Здесь вы найдете информацию о костылях и технологиях для обработки естественных языков. Канал предлагает обзоры статей и личный опыт в данной области от @cointegrated. Если вы интересуетесь языками и их обработкой, то этот канал станет для вас ценным источником информации. Узнавайте последние тенденции и новинки в области обработки естественных языков, делитесь своими идеями и опытом с другими участниками канала. Присоединяйтесь к нам прямо сейчас и расширьте свои знания в этой увлекательной области!
08 Nov, 15:37
29 Oct, 20:26
27 Oct, 14:28
06 Oct, 13:06
30 Sep, 08:09
26 Sep, 16:57
25 Sep, 17:42
24 Sep, 19:37
24 Sep, 19:37
import torch
from transformers import BertForMaskedLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("cointegrated/bert-char-ctc-en-ru-translit-v0", trust_remote_code=True)
model = BertForMaskedLM.from_pretrained("cointegrated/bert-char-ctc-en-ru-translit-v0")
text = 'Hello world! My name is David Dale, and yours is Schwarzenegger?'
with torch.inference_mode():
batch = tokenizer(text, return_tensors='pt', spaces=1, padding=True).to(model.device)
logits = torch.log_softmax(model(**batch).logits, axis=-1)
print(tokenizer.decode(logits[0].argmax(-1), skip_special_tokens=True))
# хэло Уорлд май нэйм из дэвид дэйл энд ёрз из скУорзэнэгжэр
24 Sep, 14:29
23 Sep, 20:38
18 Sep, 08:20
03 Sep, 21:04
25 Aug, 12:41
23 Aug, 09:48
21 Aug, 15:23
09 Aug, 21:20
29 Jul, 13:33
25 Jul, 10:01
22 Jul, 21:41
22 Jul, 14:13
21 Jul, 10:23