抖音视频自动发布
"点上方卡片关注公众号 / 不要错过精彩文章"
📢 船长的文章主要是实操攻略,至今已经更新Coze方面60余篇文章,现陆续加入RPA相关方面教程,旨在跟大家一起交流RPA+Coze相关技术,本文作者"阿坡RPA",跟着船长团队一步一步学起不迷路🌟"
加船长微信领提示词白皮书,加入RPA技术交流群吧 !
全流程自动化的效果是:输入一个领域关键词(种子关键词),RPA自动返回仿写好的爆款文案。用户无须关心中间黑盒做了什么,只需要关注我给你的输出是不是你想要的。
这个黑盒子具体都做了哪些事情呢?
1、热词采集
2、筛选并采集爆款数据
3、下载爆款视频
4、提取爆款文案
5、仿写爆款文案
6、风控监测
7、数字人口播视频自动生成
8、自动发布
二、全流程SOP
一)采集热门关键词
所有平台下拉关键词都是必须要重视的数据,它代表着围绕核心关键词,大家都关心哪些方面内容,是我们采集爆款的基础数据;也是我们创作方向的重要参照指标之一;
1、流程
这一步的逻辑非常简单,就是以下四步:
1、读取Excel配置文件
2、循环搜索种子关键词
3、用xpath采集触发出来的热门下拉关键词
4、采集结果写入Excel
2、核心流程
下拉词列表是输入框聚焦才显示,失焦就消失了,这给抓取下拉列表增加了一点难度,解决办法就是,点击输入框元素后,触发下拉词显示,然后用xpath获取下拉词内容。
a、给输入框元素输入关键词(参照物定位)
//*[@class="btn-title"]/../preceding-sibling::*[1]/input
b、点击输入框元素,以触发下拉词显示
//*[@class="btn-title"]/../preceding-sibling::*[1]/input
c、获取下拉词快元素内文本,以抓取下拉词
//*[@class="btn-title"]/../following-sibling::*[1]
二)采集爆款视频元数据
1、流程
1)搜索热词
直接用上一步的领域热词拼接好的url打开网页,一步直达用户tab下,省去一次元素捕获和点击
https://www.douyin.com/search/{领域热词}?type=user
2)鼠标悬浮至【筛选】按钮
筛选元素xpath表达式:
//span[text()="筛选"]
3)点击【个人认证】元素
【个人认证】元素xpath表达式:
//span[text()="个人认证"]
4)循环内博主列表
a、UI界面
b、核心流程:
a)博主昵称列表:
通过获取文本内容,得到昵称列表,结果举例:['广律在线(法律服务)','政一法律咨询','申鑫法律咨询']
//*[@id="search-content-area"]/div/div[1]/div[2]/div[3]/ul/li/div/a/div[1]/div[2]/div[1]/p/span/span/span/span/span/span
b)博主主页链接列表:
//*[@id="search-content-area"]/div/div[1]/div[2]/div[3]/ul/li/div/a
c)通过获取元素超链接,得到每个博主的主页链接,结果举例:
['https://www.douyin.com/user/MS4wLjABAAAA9yDV0aMGSGEjMXi3QfuBZXcSKNJj-haMQqdA0j5kyHk','https://www.douyin.com/user/MS4wLjABAAAAYVY6TLM8UVMNepMfRqWYVyBuMN04OH9rSxgHxod8XtM','https://www.douyin.com/user/MS4wLjABAAAAA0X9xRlTpTkSFgqbqAkhF0Q7OYain3jEt0F8vD4ysnDL-8Sh--Xw1C1wjqFzPbMq']
d)通过zip()函数将昵称和主页链接转换成元组,将其关系对应上,比如:
[ ('广律在线(法律服务)','https://www.douyin.com/user/MS4wLjABAAAA9yDV0aMGSGEjMXi3QfuBZXcSKNJj-haMQqdA0j5kyHk'), ('政一法律咨询','https://www.douyin.com/user/MS4wLjABAAAAYVY6TLM8UVMNepMfRqWYVyBuMN04OH9rSxgHxod8XtM'), ('申鑫法律咨询','https://www.douyin.com/user/MS4wLjABAAAAA0X9xRlTpTkSFgqbqAkhF0Q7OYain3jEt0F8vD4ysnDL-8Sh--Xw1C1wjqFzPbMq') ]
5)浏览博主主页
6)获取博主视频列表
a、UI界面
b、核心流程
a)视频名称列表:
获取元素超链接得到视频名称列表
//ul[@data-e2e="scroll-list"]/li/div/a/p
结果举例:
['中华人民共和国公民,在法律面前一律平等。','欠钱不还可以网上起诉,起诉流程建议收藏起来','广律在线全国连锁经营。广律愿景:让天下没有难打的官司,让人人都能打得起官司,让人人都能感受到法律的公平和公正。']
b)视频链接列表
获取元素超链接得到视频播放页面地址:
//ul[@data-e2e="scroll-list"]/li/div/a
结果举例:
['https://www.douyin.com/user/MS4wLjABAAAA9yDV0aMGSGEjMXi3QfuBZXcSKNJj-haMQqdA0j5kyHk?modal_id=7230091874088897851','https://www.douyin.com/user/MS4wLjABAAAA9yDV0aMGSGEjMXi3QfuBZXcSKNJj-haMQqdA0j5kyHk?modal_id=7243071501518359842','https://www.douyin.com/user/MS4wLjABAAAA9yDV0aMGSGEjMXi3QfuBZXcSKNJj-haMQqdA0j5kyHk?modal_id=7253096369240493347']
通过zip()函数将视频名称和视频播放页面地址转换成元组,将其关系对应上,比如:
[ ('中华人民共和国公民,在法律面前一律平等。','https://www.douyin.com/user/MS4wLjABAAAA9yDV0aMGSGEjMXi3QfuBZXcSKNJj-haMQqdA0j5kyHk?modal_id=7230091874088897851'), ('欠钱不还可以网上起诉,起诉流程建议收藏起来','https://www.douyin.com/user/MS4wLjABAAAA9yDV0aMGSGEjMXi3QfuBZXcSKNJj-haMQqdA0j5kyHk?modal_id=7243071501518359842'), ('广律在线全国连锁经营。广律愿景:让天下没有难打的官司,让人人都能打得起官司,让人人都能感受到法律的公平和公正。','https://www.douyin.com/user/MS4wLjABAAAA9yDV0aMGSGEjMXi3QfuBZXcSKNJj-haMQqdA0j5kyHk?modal_id=7253096369240493347') ]
7)循环浏览视频
8)采集视频数据
a、采集视频数据:点赞,收藏,评论,收藏,视频链接
将数据写入Excel
b、采集视频地址
在视频详情页浏览视频,获取视频数据及地址,使用xpath捕获视频地址:
获取视频地址
//*[@id="douyin-right-container"]/div[2]/div/div[1]/div[2]/div/xg-video-container/video/source[1]
三)下载资源
遍历博主视频过程中,捕获到视频地址 ,用视频下载指令,下载到本地指定文件夹目录下
四)提取文案
Autobox内部直接集成了视频提取音频,音频提取文案等功能,直接一个指令调用,即可完成内容提取,使得开发非常高效。
1、获取上一步下载的文件列表
2、从视频提取音频
提取音频指令为Autobox集成指令,从 mp4文件中提取语音,提取的格式支持wav、mp3等。
视频转音频是封装了开源的软件,微调调优后封装的,无需通过第三方工具,免去了捕获元素等麻烦,使用起来极为方便。
3、从音频提取文案
从上一步提取 的音频Wav文件中提取字幕,提取的格式仅支持wav,采用先进的语音模型进行识别。
音频转文字是开源模型,也是微调调优后封装的,开发极为方便。
4、将文案写入至txt
五)AI仿写
Autobox内部直接集成了AI大模型配置,AI Agent配置等指令,只需简单填写配置信息,即可像使用普通指令一样,跟大模型交互,自动化无需在网页端点击捕获,后台自动完成与大模型的交互,并获取结果。
1、获取上一步提取好的txt文本
略
2、调用Autobox集成好的 AI 大模型指令
通过指定参数生成Agent所需要的文本大模型内核。使用者可以指定基础URL、验证方式、模型类型、内容类型和配置信息来自定义对接指定 AI 大模型。
Agent可以灵活切换背后大模型,目前支持了chatGPT和kimi,后续可以支持任何大模型能力
3、建立角色
4、输入提示词
遍历txt文案,结合仿写提示词,生成仿写文案
5、获取AI大模型返回结果
6、将仿写结果写入txt文件
略
六)风控监测
通过python脚本,拿仿写文案过一下下载好的抖音风险词库,设定一个风险词命中率,超过指定命中率则过滤掉,并记录,以下是检测脚本,会返回违禁词命中词汇和命中率
# pip install jieba
import jieba
file_path = r'C:\Users\Administrator\Desktop\rpa\抖音违禁词\抖音违禁词列表.txt'
with open(file_path,'r', encoding='utf-8')as file:
banned_words_str = file.read()
banned_words_list = banned_words_str.split(',')
banned_words_set =set(banned_words_list)
text_str ="我们的产品销量问鼎全球,绝无仅有,品质保证,业界公认的效果,彻底解决您的后顾之忧,绝对的性价比之王。"
target_words = jieba.lcut(text_str)
words_hit ={word for word in target_words if word in banned_words_set}
print(f"命中词汇: {list(words_hit)}")
hit_rate = len(words_hit)/ len(banned_words_set)if banned_words_set else0
print(f"文本b中的词语在词库a中的命中率: {hit_rate:.2%}")
七)转成视频
通过数字人平台,输入仿写文案,生成数字人口播视频
其中,选择形象,声音克隆等操作,需要提前设置好
(略)
八)自动发布
1、点击投稿
【投稿】元素xpath:
//*[@id="douyin-header"]/div[1]/header/div/div/div[2]/div/pace-island/div/child::*[last()]/preceding-sibling::*[1]
2、点击发布视频
【发布作品】元素xpath:
//*[@id="douyin-creator-master-side-upload"]
【发布视频】元素xpath:
//*[@class="semi-dropdown-content"]/ul/li[1]
3、上传文件
a、UI界面
b、核心流程
本步骤不需要先点击,再选择文件,然后上传,直接使用xpath,一行指令,即可实现上传:
xpath定位到上传元素input:
//*[@id="root"]/div/div/div[3]/div/div[1]/div/div[1]/div/label/input
给上传元素的value属性赋值
r'C:\Users\Administrator\Desktop\rpa\下拉词采集机器人运行demo-1.mp4'
4、等待上传完成
a、UI界面
b、等待元素消失
上传过程中,会显示"取消上传"元素,上传完后,该元素会消失
//*[@id="root"]/div/div/div[2]/div[2]/div/div/div/div/div/div/p[2]
5、填写视频信息
a、UI界面
b、输入标题
//*[@id="root"]/div/div/div[2]/div[1]/div[2]/div/div/div/div[1]/div/div/input
c、输入描述信息
//*[@id="root"]/div/div/div[2]/div[1]/div[2]/div/div/div/div[2]/div
6、滚动到发布按钮
PS:通过xpath元素点击元素,通常是一步到位的,这就容易触发平台封控,所以需要模拟人类操作,滚动到发布按钮元素,然后才是点击
//*[@id="root"]/div/div/div[2]/div[1]/div[17]/button[1]
7、点击发布
PS:发布时,虽然可以通过xpath一步到位点击发布按钮,但是不建议这么做,我们需要模拟人的操作,滚动到发布按钮,再点击
a、UI界面
b、核心流程
【发布按钮】xpath:
//*[@id="root"]/div/div/div[2]/div[1]/div[17]/button[1]
三、Autobox特点
本案例全程使用的 xpath 操作,用大家熟悉的影刀或者 Uibot 实现思路类似,我用的工具是我们团队小伙伴自研的 RPA 工具,它有如下特点:
1、 内部集成调用大模型指令,让机器人有手脚,又有大脑
2、网页端, win 软件(内测中),手机端,全部支持 xpath 操作,运行更稳定。
3、以应用为单位绑定设备运行,权限控制灵活
4、开箱即用,只需配置 excel 文件,一键运行,无需关注实现细节
5、设计权限与运行权限分离,仅有权限的开发者可以设计流程,开发好的流程可以上传到商店,应用可以灵活授权给指定用户,无需使用者开发
没有评论:
发表评论