Всё, что я хотел знать о DALL-E 2 | 27 июля 2022 года, 02:01

Получил доступ к DALL-E 2.

Поражает, конечно.

Первые две картинки сгенерированы по фразе “мама с дочкой с открытым красным зонтом на лошади дождливой ночью в стиле картины”. Круто же!

Еще две картинки сгенерированы по фразе “The painting depicts a scene with watches melting slowly on rocks and the branch of a tree, with the ocean as a back drop”. Я просто описал картину Сальвадора Дали, и DALL-E сделал свою версию.

Также попросил DALL-E нарисовать картинку по фразе “an impressionist oil painting of a female figure skater dancing with her male partner, with the mountains and lakes as a back drop”, У меня как раз Маша сейчас катается в Lake Placid.

Вот редко меня всякие компьютерные штуки удивляют, потому что я в целом понимаю как они работают. Тут вроде тоже понимаю, но уже с трудом, с большим трудом, и результат сильно, сильно лучше самых смелых ожиданий.

Думаю, что вскоре появятся специалисты по формулировке ТЗ для такой штуки в виде текста. Они будут умудряться получать более качественные картинки за счет формулировок

Введение смысла в распознавание текста из голоса | 20 июля 2022 года, 10:12

Интересно, почему все программы распознавания текста из голоса не пытаются определить тему и подгрузить термины, свойственные этой теме? Вот идет разговор про условно лошадей. Подгрузи словарь с терминами, лошадиными брендами, типичными кличками, названиями ипподромов или что там еще, и проверни распознавание еще раз, используя термины из этого словаря с большим весом, чем термины, скажем, из айти или кулинарии. Понять, что речь идет о лошадях из текста AI уже давно может. А вот приспосабливаться не может.

Ну или вот взять распознавание в Teams. Майкрософт, у вас гигабайты сообщений из чатов и групп есть. Уж очевидно, что примерно те же слова будут звучать в аудио. Почему бы не составить словарик из таких слов, и не загрузить в систему распознавания голоса, чтобы записи расшифровывались более корректно? Я уже не говорю о том, что один и тот же человек пишет и говорит голосом в целом на одну и ту же тему. Если вот прям его сообщения взять для словарика и применять словарик к репликам, которые произносит он, и во вторую очередь к тем, кто на колле, то вообще будет ж прекрасно.

Можно подумать, как улучшать существующие распознавания. Типа за неделю копим знания как звучит, скажем, Medik8, и как пишется (из чатов), и затем все неправильно распознанные medicate меняем на Medik8 в прошлых митингах (и чтобы поиск работал уже с учетом изменений). Понимание, что это неправильно распознано, нетривиально для машины, но все-таки возможно, так как слово medicate будет явно грамматически не подходить, в отличие от Medik8

Должен появиться нормальный стартап, который интегрируется с мессенджерами и приложениями для встреч, и вот все это делает по уму, беря какие-то деньги. Если бы все внутренние встречи расшифровывались (нормально! с репликами, именами, учетом тематики) и по этому был единый поиск с учетом прав доступа (искать можно только по митингам, где ты приглашен), то это был бы супертул.

YouTubes Sudden Shift: Picture-in-Picture Mode Activated on Non-Premium iPhone Devices? | 20 июля 2022 года, 10:00

У меня на iPhone Youtube недавно внезапно стал работать в бэкграунде. То есть, уходишь с приложения, а видео продолжает идти в окне (Picture-in-picture). Раньше это было только в Premium, и у меня точно его нет.

У вас такая же ситуация? или у меня аппа в правильном направлении глюканула?

Директор — это менеджер менеджеров: простая формула для понимания роли | 17 июля 2022 года, 22:55

Простая формула, о которой я никогда не задумывался, проработав в директорской позиции в нескольких компаниях: директор – это менеджер менеджеров. Если ты директор, а под тобой специалисты (individual contributors), то ты не директор, а менеджер, как бы твоя позиция не называлась.

Развивая тему, если же ты менеджер, а под тобой нет подчинённых (тех, кто перед тобой отчитывается и за чью работу ты несёшь ответственность), то ты не менеджер, а по сути специалист. В области управления проектами, или продаж, или закупок, или HR.

Были бы такие простые определения, всем было бы удобно. Согласны?

End-to-End Test Automation: The Case for a Custom Framework | 12 июля 2022 года, 22:36

Just published a new article on Hybrismart.com:

End-to-End Test Automation: Why Was It Worth to Write Our Custom Framework

There are dozens, even hundreds of test automation frameworks available, and we developed our own. Why? Why? Was it worth the effort?

This article describes our needs and our solution, E2E CLI: the architecture of the API testing tool which has been used by our team for about 2 years. Back in 2020, it was developed by me from scratch over the course of a weekend — In other words, it is a very simple piece based on very simple ideas.

We use this tool to end-to-end test all our services and integration flows. Whenever we make changes to a software system, we need to ensure that they do not break what was already working.

As the architect and lead developer, I designed and developed it from the ground up, so, of course, I am very proud of my brainchild. But the field cannot be well seen from within the field. You know, reinventing wheels is not always bad. When you build something on your own, you are in full control over what is being built, what its purpose will be, and when it is finally conceived and executed as you wish. It has been two years since I have encountered any alternative to our solution.

To reach a wider audience, I found it beneficial to share key concepts hoping to get some feedback from the community and enhance the product.

https://hybrismart.com/2022/07/12/7798/

https://hybrismart.com/2022/07/12/7798/

Flush with Excitement: A First Look at Toilet Monitoring System | 06 июля 2022 года, 04:42

Первый раз вижу систему мониторинга туалетов. Это ж можно графики строить и алерты кидать персоналу.