Hi,

很高兴尝试native K8s,默认情况下Pod的log是没有输出到console的,所以
会导致kubectl logs查看不了,可以参考这个文档[1]进行配置,然后看到具体报错。

当然,需要首先确认的是service、deployment、ConfigMap已经创建成功,如果失败
的话,Flink client端应该会有报错信息的

[1].
https://ci.apache.org/projects/flink/flink-docs-master/ops/deployment/native_kubernetes.html#log-files


Best,
Yang


<[email protected]> 于2020年5月27日周三 上午11:21写道:

>
>
> 在两个kubernetes版本下进行一样的操作,结果如下:
>
> v1.17.4  失败
> v1.15.1  成功
>
>
> 步骤如下:
>
>
> 创建rbac
>
> rbac.yaml
>
> apiVersion: v1
> kind: ServiceAccount
> metadata:
>  name: flink
>  namespace: flink
> ---
>
> apiVersion: rbac.authorization.k8s.io/v1
> kind: ClusterRoleBinding
> metadata:
>  name: flink-role-binding
> roleRef:
>  apiGroup: rbac.authorization.k8s.io
>  kind: ClusterRole
>  name: edit
> subjects:
> - kind: ServiceAccount
>  name: flink
>  namespace: flink
>
>
>
> 然后运行如下语句:
>
> /usr/local/flink/flink-1.10.1/bin/kubernetes-session.sh \
>          -Dkubernetes.cluster-id=flink \
>          -Dkubernetes.jobmanager.service-account=flink \
>          -Dtaskmanager.memory.process.size=4096m \
>          -Dkubernetes.taskmanager.cpu=2 \
>          -Dtaskmanager.numberOfTaskSlots=4 \
>          -Dkubernetes.namespace=flink \
>          -Dkubernetes.rest-service.exposed.type=NodePort \
>          -Dakka.framesize=104857600b \
>          -Dkubernetes.container.image=flink:1.10.1
>
>
> 在1.15可以正常构建出集群,在1.17版本会出现Back-off restarting failed
> container,查看日志除了如下日志无其他输出
>
> Start command : /bin/bash -c $JAVA_HOME/bin/java -classpath
> $FLINK_CLASSPATH -Xms424m -Xmx424m -Dlog.file=/opt/flink/log/jobmanager.log
> -Dlogback.configurationFile=file:/opt/flink/conf/logback.xml
> -Dlog4j.configuration=file:/opt/flink/conf/log4j.properties
> org.apache.flink.kubernetes.entrypoint.KubernetesSessionClusterEntrypoint
> 1> /opt/flink/log/jobmanager.out 2> /opt/flink/log/jobmanager.err
>
>
> 尝试过通过job的方式提交,yaml如下:
>
>
> apiVersion: batch/v1
> kind: Job
> metadata:
>  name: boot-flink
>  namespace: flink
> spec:
>  template:
>    spec:
>      serviceAccount: flink
>      restartPolicy: OnFailure
>      containers:
>      - name: start
>        image: flink:1.10.1
>        workingDir: /opt/flink
>        command: ["bash", "-c", "$FLINK_HOME/bin/kubernetes-session.sh \
>          -Dkubernetes.cluster-id=roc \
>          -Dkubernetes.jobmanager.service-account=flink \
>          -Dtaskmanager.memory.process.size=1024m \
>          -Dkubernetes.taskmanager.cpu=1 \
>          -Dtaskmanager.numberOfTaskSlots=1 \
>          -Dkubernetes.container.image=flink:1.10 \
>          -Dkubernetes.namespace=flink"]
>
> 在1.15版本正常,在1.17版本,无法构建出对应的service,失败的现象不一样。
>
>
>
> 我的操作是否是有其他疏漏的地方?目前我遭遇到的使用场景说明如上,希望得到一些回复和解答说明,非常感谢。
>
> Looking forward to your reply and help.
>
> Best
>
>
> | |
> a511955993
> |
> |
> 邮箱:[email protected]
> |
>
> 签名由 网易邮箱大师 定制

回复